Uma reportagem recente da MIT Technology Review Brasil trouxe à tona o dilema central da personalização em escala: até onde uma empresa pode ir na coleta e uso de dados sem cruzar a linha entre conveniência e vigilância. O debate, que parecia restrito à privacidade, agora converge diretamente com outra fronteira igualmente sensível: o direito autoral na era da IA generativa.
Modelos como GPT-4, Gemini, Claude e seus equivalentes nacionais foram treinados com bilhões de textos, imagens, músicas e códigos disponíveis na internet. Parte desse conteúdo é protegida por direitos autorais. A pergunta que ninguém respondeu de forma definitiva ainda é: isso é legal? No Brasil, a resposta está longe de ser simples.
Este artigo analisa o estado atual do debate jurídico sobre direitos autorais e IA generativa no Brasil, os riscos concretos para empresas que desenvolvem ou integram modelos generativos e o que founders, CTOs e advogados precisam monitorar agora.
Contexto jurídico e regulatório
O vácuo na Lei de Direitos Autorais
A Lei 9.610/1998 (LDA) é o principal diploma regulatório de direitos autorais no Brasil. Ela foi promulgada quando a internet ainda era embrionária e não prevê, em nenhum dispositivo, o uso de obras protegidas para treinamento de sistemas de inteligência artificial.
O artigo 46 da LDA lista as hipóteses de uso livre de obras protegidas sem necessidade de autorização ou pagamento. Entre elas estão reproduções para uso privado, fins didáticos e citações. Nenhuma dessas hipóteses cobre, com clareza, o processo de ingestão massiva de dados para treinar modelos de IA.
Nos Estados Unidos, o debate gira em torno do conceito de fair use (uso justo), previsto no Copyright Act de 1976. Empresas como a OpenAI argumentam que o treinamento de IA se enquadra nessa doutrina. No Brasil, o equivalente funcional seria o artigo 46, mas sua interpretação restritiva pelos tribunais torna esse argumento mais frágil aqui do que no mercado norte-americano.
Autoria de obra gerada por IA: quem é o titular?
A LDA exige, em seu artigo 11, que o autor seja uma pessoa física. Isso cria um problema imediato: obras geradas exclusivamente por IA não têm titular reconhecido pela lei brasileira. Sem titularidade, não há proteção autoral sobre o output gerado.
O Escritório de Direitos Autorais dos EUA já firmou posição semelhante em 2023, ao negar registro a obras criadas sem intervenção humana criativa substancial. No Brasil, o INPI e a Biblioteca Nacional ainda não emitiram diretriz formal consolidada sobre o tema, o que gera insegurança para empresas que desejam proteger produtos baseados em conteúdo gerado por IA.
Do ponto de vista prático, isso significa que um texto, imagem ou código produzido por um modelo generativo pode ser livremente copiado por concorrentes, salvo se houver curadoria humana suficiente para caracterizar co-autoria. O critério de "suficiência" ainda não foi definido por nenhum tribunal brasileiro.
O Projeto de Lei 2.338/2023 e seus desdobramentos
O PL 2.338/2023, conhecido como o marco regulatório brasileiro de IA, tramita no Senado Federal e inclui disposições sobre responsabilidade de sistemas de IA de alto risco. No entanto, o texto original não endereça diretamente a questão dos direitos autorais no treinamento de modelos.
Em paralelo, o Ministério da Cultura lançou, em 2024, consulta pública sobre o impacto da IA no setor criativo. As contribuições indicaram forte pressão de criadores, músicos, escritores e programadores por mecanismos de remuneração ou opt-out para uso de suas obras em treinamento de modelos. Até a data de publicação deste artigo, nenhuma norma específica foi aprovada.
Impacto prático
Para startups que desenvolvem modelos generativos ou produtos baseados neles, o risco jurídico mais imediato está no pipeline de treinamento. Usar datasets obtidos por scraping de sites, repositórios públicos ou plataformas de conteúdo sem verificar os termos de uso pode gerar litígios cíveis por violação de direitos autorais, com pedidos de indenização e até bloqueio judicial do produto.
Casos como Getty Images v. Stability AI (Reino Unido, 2023) e o processo movido por músicos contra a Anthropic (EUA, 2024) mostram que esse risco é real e crescente. No Brasil, o custo de uma ação de direitos autorais pode incluir indenização de até 3.000 exemplares da obra (artigo 103 da LDA) ou o valor que o autor deixou de receber, acrescido de danos morais. Para uma startup em estágio inicial, isso pode ser existencial.
A recomendação prática para CTOs e founders é implementar, agora, um processo formal de due diligence sobre as fontes de dados utilizadas no treinamento. Isso inclui mapear licenças (Creative Commons, open data, licenças proprietárias), documentar decisões e, quando necessário, buscar licenciamento direto com detentores de direitos. Essa documentação também é relevante para due diligence em rodadas de investimento: fundos de venture capital com portfólio em IA já incluem perguntas específicas sobre IP nos processos de análise.
Considerações finais
O debate sobre personalização em escala trazido pela MIT Technology Review Brasil é o sintoma visível de uma tensão mais profunda: a velocidade da adoção de IA superou a capacidade das estruturas jurídicas de acompanhá-la. No campo dos direitos autorais, esse descompasso é especialmente crítico porque os passivos podem se acumular silenciosamente durante anos e emergir apenas quando a empresa já tem tração e visibilidade suficientes para virar alvo.
Founders, CTOs e advogados que atuam com empresas de IA não podem aguardar a aprovação de uma lei específica para agir. O risco existe hoje, com a legislação vigente. A diferença entre empresas que prosperam e as que enfrentam crises de IP estará, cada vez mais, na qualidade da governança jurídica construída desde o início do desenvolvimento do produto.