Direitos autorais e IA generativa no Brasil

Por SAFIE · 17 de junho de 2026 · 5 min de leitura

Uma reportagem recente da MIT Technology Review Brasil trouxe à tona o dilema central da personalização em escala: até onde uma empresa pode ir na coleta e uso de dados sem cruzar a linha entre conveniência e vigilância. O debate, que parecia restrito à privacidade, agora converge diretamente com outra fronteira igualmente sensível: o direito autoral na era da IA generativa.

Modelos como GPT-4, Gemini, Claude e seus equivalentes nacionais foram treinados com bilhões de textos, imagens, músicas e códigos disponíveis na internet. Parte desse conteúdo é protegida por direitos autorais. A pergunta que ninguém respondeu de forma definitiva ainda é: isso é legal? No Brasil, a resposta está longe de ser simples.

Este artigo analisa o estado atual do debate jurídico sobre direitos autorais e IA generativa no Brasil, os riscos concretos para empresas que desenvolvem ou integram modelos generativos e o que founders, CTOs e advogados precisam monitorar agora.

Contexto jurídico e regulatório

O vácuo na Lei de Direitos Autorais

A Lei 9.610/1998 (LDA) é o principal diploma regulatório de direitos autorais no Brasil. Ela foi promulgada quando a internet ainda era embrionária e não prevê, em nenhum dispositivo, o uso de obras protegidas para treinamento de sistemas de inteligência artificial.

O artigo 46 da LDA lista as hipóteses de uso livre de obras protegidas sem necessidade de autorização ou pagamento. Entre elas estão reproduções para uso privado, fins didáticos e citações. Nenhuma dessas hipóteses cobre, com clareza, o processo de ingestão massiva de dados para treinar modelos de IA.

Nos Estados Unidos, o debate gira em torno do conceito de fair use (uso justo), previsto no Copyright Act de 1976. Empresas como a OpenAI argumentam que o treinamento de IA se enquadra nessa doutrina. No Brasil, o equivalente funcional seria o artigo 46, mas sua interpretação restritiva pelos tribunais torna esse argumento mais frágil aqui do que no mercado norte-americano.

Autoria de obra gerada por IA: quem é o titular?

A LDA exige, em seu artigo 11, que o autor seja uma pessoa física. Isso cria um problema imediato: obras geradas exclusivamente por IA não têm titular reconhecido pela lei brasileira. Sem titularidade, não há proteção autoral sobre o output gerado.

O Escritório de Direitos Autorais dos EUA já firmou posição semelhante em 2023, ao negar registro a obras criadas sem intervenção humana criativa substancial. No Brasil, o INPI e a Biblioteca Nacional ainda não emitiram diretriz formal consolidada sobre o tema, o que gera insegurança para empresas que desejam proteger produtos baseados em conteúdo gerado por IA.

Do ponto de vista prático, isso significa que um texto, imagem ou código produzido por um modelo generativo pode ser livremente copiado por concorrentes, salvo se houver curadoria humana suficiente para caracterizar co-autoria. O critério de "suficiência" ainda não foi definido por nenhum tribunal brasileiro.

O Projeto de Lei 2.338/2023 e seus desdobramentos

O PL 2.338/2023, conhecido como o marco regulatório brasileiro de IA, tramita no Senado Federal e inclui disposições sobre responsabilidade de sistemas de IA de alto risco. No entanto, o texto original não endereça diretamente a questão dos direitos autorais no treinamento de modelos.

Em paralelo, o Ministério da Cultura lançou, em 2024, consulta pública sobre o impacto da IA no setor criativo. As contribuições indicaram forte pressão de criadores, músicos, escritores e programadores por mecanismos de remuneração ou opt-out para uso de suas obras em treinamento de modelos. Até a data de publicação deste artigo, nenhuma norma específica foi aprovada.

Impacto prático

Para startups que desenvolvem modelos generativos ou produtos baseados neles, o risco jurídico mais imediato está no pipeline de treinamento. Usar datasets obtidos por scraping de sites, repositórios públicos ou plataformas de conteúdo sem verificar os termos de uso pode gerar litígios cíveis por violação de direitos autorais, com pedidos de indenização e até bloqueio judicial do produto.

Casos como Getty Images v. Stability AI (Reino Unido, 2023) e o processo movido por músicos contra a Anthropic (EUA, 2024) mostram que esse risco é real e crescente. No Brasil, o custo de uma ação de direitos autorais pode incluir indenização de até 3.000 exemplares da obra (artigo 103 da LDA) ou o valor que o autor deixou de receber, acrescido de danos morais. Para uma startup em estágio inicial, isso pode ser existencial.

A recomendação prática para CTOs e founders é implementar, agora, um processo formal de due diligence sobre as fontes de dados utilizadas no treinamento. Isso inclui mapear licenças (Creative Commons, open data, licenças proprietárias), documentar decisões e, quando necessário, buscar licenciamento direto com detentores de direitos. Essa documentação também é relevante para due diligence em rodadas de investimento: fundos de venture capital com portfólio em IA já incluem perguntas específicas sobre IP nos processos de análise.

Considerações finais

O debate sobre personalização em escala trazido pela MIT Technology Review Brasil é o sintoma visível de uma tensão mais profunda: a velocidade da adoção de IA superou a capacidade das estruturas jurídicas de acompanhá-la. No campo dos direitos autorais, esse descompasso é especialmente crítico porque os passivos podem se acumular silenciosamente durante anos e emergir apenas quando a empresa já tem tração e visibilidade suficientes para virar alvo.

Founders, CTOs e advogados que atuam com empresas de IA não podem aguardar a aprovação de uma lei específica para agir. O risco existe hoje, com a legislação vigente. A diferença entre empresas que prosperam e as que enfrentam crises de IP estará, cada vez mais, na qualidade da governança jurídica construída desde o início do desenvolvimento do produto.

Perguntas frequentes

Posso usar dados públicos da internet para treinar meu modelo de IA sem pagar direitos autorais?

Não necessariamente. O fato de um conteúdo estar publicamente acessível na internet não significa que ele está em domínio público ou que seu uso para treinamento de IA é permitido. A Lei 9.610/1998 protege obras pelo simples ato de criação, independentemente de registro. Você precisa verificar a licença de cada fonte de dados utilizada. Conteúdos sob Creative Commons com cláusula NC (non-commercial) ou ND (no derivatives), por exemplo, podem ser incompatíveis com uso comercial em treinamento de IA.

Quem é o dono dos direitos autorais de um conteúdo gerado por IA?

Pela Lei 9.610/1998, o autor deve ser uma pessoa física. Isso significa que obras geradas exclusivamente por IA, sem intervenção humana criativa relevante, não têm proteção autoral no Brasil. Se houver curadoria, seleção ou edição humana substancial no processo, pode-se argumentar pela co-autoria do humano. Mas esse critério ainda não foi definido por tribunais brasileiros, o que cria insegurança jurídica real para produtos de IA.

Minha startup pode ser processada por usar obras de terceiros para treinar um modelo de IA no Brasil?

Sim. A Lei 9.610/1998 prevê responsabilidade civil por uso não autorizado de obras protegidas. Casos internacionais como Getty Images v. Stability AI mostram a tendência. No Brasil, a indenização pode ser calculada com base no artigo 103 da LDA (até 3.000 exemplares da obra) ou no valor que o autor deixou de receber, mais danos morais. O risco é maior para empresas com produtos de alto perfil e receita visível.

O que o marco regulatório de IA (PL 2.338/2023) diz sobre direitos autorais?

O PL 2.338/2023, em sua versão mais recente, foca principalmente em responsabilidade civil por danos causados por sistemas de IA de alto risco e em transparência algorítmica. Ele não endereça diretamente o uso de obras protegidas para treinamento de modelos. A regulação específica de direitos autorais e IA ainda depende de alterações na Lei 9.610/1998 ou de norma específica, nenhuma das quais foi aprovada até junho de 2026.

Como fazer due diligence de propriedade intelectual antes de uma rodada de investimento em startup de IA?

O processo deve incluir: (1) mapeamento completo de todas as fontes de dados usadas no treinamento, com verificação das licenças de cada uma; (2) documentação das decisões tomadas sobre uso de dados (atas, políticas internas); (3) análise dos contratos com fornecedores de dados ou APIs; (4) avaliação de eventuais notificações ou reclamações de titulares de direitos já recebidas. Fundos de venture capital com foco em IA já incluem perguntas específicas sobre IP na due diligence, e passivos ocultos nessa área podem inviabilizar ou reduzir o valuation de uma rodada.

Fontes e referências

MIT Technology Review Brasil
Fonte original: MIT Technology Review Brasil - "Personalização em escala: entre relevância e vigilância" (https://mittechreview.com.br/personalizacao-escala-relevancia-vigilancia/)
Lei 9.610/1998 - Lei de Direitos Autorais do Brasil (https://www.planalto.gov.br/ccivil_03/leis/l9610.htm)
PL 2.338/2023 - Marco Regulatório Brasileiro de Inteligência Artificial (https://www25.senado.leg.br/web/atividade/materias/-/materia/157233)
U.S. Copyright Office - "Copyright and Artificial Intelligence" (2023/2024) (https://www.copyright.gov/ai/)
Getty Images v. Stability AI - High Court of England and Wales (2023)
Ministério da Cultura do Brasil - Consulta Pública sobre IA e Setor Criativo (2024) (https://www.gov.br/cultura/)
Escritório de Direitos Autorais dos EUA - Decisão sobre obras geradas por IA sem autoria humana (2023)