Modelos de IA de uso geral e opt-outs: chave jurídica para os titulares de DPI
1. Aplicação das obrigações do Regulamento (UE) 2024/1689 relativo à inteligência artificial aos modelos de IA de uso geral
A inteligência artificial ("IA"), tal como se tornou popular e é amplamente utilizada na sociedade, resulta do aparecimento de modelos de IA de uso geral ("modelos de IA"). Mais concretamente, aqueles capazes de gerar conteúdos (texto, gráficos, música, etc.) e que se enquadram na chamada "IA generativa", como o ChatGPT, o Copilot, o Midjourney ou o DALL-E.
Estes modelos de IA alteraram estruturalmente a relação entre a tecnologia e os direitos de autor, recorrendo à utilização maciça de conteúdos protegidos por direitos de autor, sem autorização, para treino e geração de resultados.
Em resposta a estes desafios, o Regulamento (UE) 2024/1689 relativo à Inteligência Artificial ("Regulamento IA"), já em vigor, estabelece um quadro regulamentar exigente cuja aplicação será faseada ao longo do tempo.
A próxima etapa do seu processo de implementação terá lugar a partir de 2 de agosto de 2025. Até essa data, os fornecedores de modelos de IA terão de cumprir, entre outras obrigações, as previstas no artigo 53.º do Regulamento IA, que inclui o dever de estabelecer orientações para cumprir a legislação da UE em matéria de direitos de autor e, em especial, de identificar e respeitar qualquer reserva de direitos ("opt-out") expressa em conformidade com o artigo 4.º, n.º 3, da Diretiva (UE) 2019/790 ("DSM").
Esta obrigação exige que os fornecedores de modelos de IA apliquem mecanismos técnicos adequados, tais como tecnologias de rastreio, opt-out automático ou protocolos legíveis por máquina, que permitam a exclusão do processo de formação de obras relativamente às quais os titulares de direitos tenham expressamente exercido o seu direito de oposição de forma clara, específica e tecnicamente reconhecível.
2. O que é um opt-out?
Um opt-out é uma reserva expressa de direitos feita pelos titulares de obras protegidas, informando os fornecedores de modelos de IA de que determinados conteúdos não podem ser utilizados em processos de extração de dados para treinar os seus modelos de IA.
Esta exclusão, reconhecida no n.º 3 do artigo 4.º do DSM, não impede o acesso público e a indexação das obras quando estas estão legalmente disponíveis em linha, mas proíbe a sua reutilização automatizada em actividades de extração de dados em massa para efeitos de desenvolvimento de modelos de IA.
Ferramentas técnicas recomendadas para exprimir um opt-out efetivo:
Ferramenta | Descrição | Exemplo de utilização |
robots.txt | Ficheiro de exclusão padrão para os rastreadores da Web | Não permita: /meu-trabalho/ |
ai.txt | Proposta de pop-up para excluir conteúdo de IA | Não permitir: /data/ ao abrigo de uma política de IA específica |
ISCC | Identificador único de conteúdos digitais | Vincula a auto-exclusão a obras específicas, mesmo que disseminadas em múltiplos sítios |
Metadados XMP/IPTC | Informação incorporada em imagens, áudio ou vídeo | Exclusão ao nível do ficheiro multimédia |
Marca de água digital | Marca de água visível ou invisível | Verificável pela IA e por terceiros |
3. Evolução e propostas legislativas
Em 10 de julho de 2025, foi publicada a versão final do Código de Boas Práticas, que estabelece os compromissos voluntários assumidos pelos principais fornecedores de modelos de inteligência artificial generativa, a fim de assegurar uma aplicação técnica adequada do quadro jurídico europeu. Em particular, este Código estabelece uma série de obrigações técnicas mínimas que os criadores devem cumprir quando realizam actividades de extração de dados em conteúdos acessíveis em linha:
- Proibição de contornar as medidas tecnológicas eficazes destinadas a restringir o acesso não autorizado, incluindo os mecanismos de pagamento ou de subscrição (paywalls), em conformidade com o n.º 3 do artigo 6.º da Diretiva 2001/29/CE.
- Excluir ativamente sítios Web que tenham sido identificados pelas autoridades ou tribunais da UE como fontes persistentes de violação de direitos de autor à escala comercial. A Comissão Europeia manterá uma lista actualizada desses sítios para facilitar a sua exclusão.
- Respeite as reservas de direitos expressas por meios legíveis por máquina, em conformidade com o artigo 4.º, n.º 3, da Diretiva (UE) 2019/790, utilizando:
- Crawlers compatíveis com o protocolo robots.txt de acordo com a norma IETF RFC 9309 ou as suas futuras versões reconhecidas como tecnicamente viáveis.
- Outros protocolos de exclusão adequados (por exemplo, metadados por bem ou localização), que tenham sido adoptados por organismos de normalização ou amplamente aplicados pelos sectores culturais em causa.
- Estes protocolos devem fornecer informações acessíveis sobre os rastreadores que utilizam e os protocolos que respeitam o opt-out e permitir mecanismos de notificação automática (por exemplo, através de um feed Web) para que os titulares de direitos possam ter conhecimento de quaisquer alterações a estas práticas.
Além disso, o projeto de relatório do Parlamento Europeu sobre direitos de autor e IA generativa foi publicado em 27 de junho de 2025, no qual propõe medidas adicionais de particular relevância:
- Pedido à Comissão para propor uma presunção de utilização de obras e outros conteúdos protegidos por direitos de autor ou direitos conexos para a formação de modelos de IA, sempre que os fornecedores não tenham cumprido as obrigações de transparência (disposição 11).
- Estabelecimento de uma obrigação de remuneração pela utilização de obras protegidas, incluindo com efeitos retroactivos (disposição 4).
- Recomendação de utilização de marcas de água ou identificadores digitais como mecanismo de controlo complementar (considerando Q).
4. precedente jurisprudencial relevante
Em setembro de 2024, o Tribunal Regional de Hamburgo pronunciou-se sobre um caso relevante relativo à utilização não autorizada de imagens protegidas por direitos de autor incorporadas num conjunto de dados utilizado para treinar um modelo de IA. O arguido invocou a exceção da utilização para fins de investigação científica, prevista na legislação europeia, como justificação para o tratamento automatizado das obras.
Embora o Tribunal tenha aceitado a aplicabilidade da exceção da exploração de dados para fins de investigação científica, não se pronunciou, à partida, de forma conclusiva sobre a questão de saber se a fórmula genérica de reserva de direitos em linguagem natural era suficiente para constituir uma renúncia efectiva nos termos do n.º 3 do artigo 4. No entanto, num obiter dictum, o Tribunal sugeriu que uma expressão clara de oposição formulada em linguagem natural poderia ser juridicamente válida e tecnicamente legível por máquina, dado que as tecnologias capazes de identificar tais exclusões já existiam em 2021.
O acórdão reconheceu expressamente que não existiam critérios técnicos harmonizados que permitissem aos titulares de direitos manifestar validamente a sua oposição à utilização das suas obras em contextos de prospeção de dados, o que cria uma área de incerteza jurídica a ser resolvida por normas técnicas claras e mecanismos interoperáveis, como os previstos no Regulamento IA e no futuro repositório gerido pelo Instituto da Propriedade Intelectual da União Europeia ("EUIPO").
5. O que pode fazer enquanto titular de DPI?
Se é titular de direitos de propriedade intelectual sobre conteúdos acessíveis em linha, quer se trate de texto, imagens, vídeo, áudio, software, bases de dados ou outras criações protegidas, e pretende impedir que as suas obras sejam utilizadas na formação de modelos de IA, recomendamos que considere a possibilidade de adotar um mecanismo de auto-exclusão em conformidade com o n.º 3 do artigo 4.
Para que esta oposição seja juridicamente válida e tecnicamente eficaz perante os fornecedores de IA, deve cumprir, pelo menos, os seguintes requisitos
- Aplicar protocolos legíveis por máquina: é essencial utilizar sistemas normalizados que permitam aos agentes automatizados identificar e respeitar a sua vontade.
- Formular uma expressão clara e específica das utilizações a proibir, diferenciando entre:
- Indexação ou mera visualização pública (que não são excluídas por defeito), e.
- Reutilização automatizada para fins de extração de dados e treino de modelos de IA (que pode ser excluída).
- Registar a reserva de direitos no futuro sistema centralizado de gestão do opt-out a gerir pelo EUIPO, uma vez operacional. Este registo facilitará a rastreabilidade, a publicidade e a consulta pelos fornecedores de modelos de IA e pelas autoridades.
- Considere a utilização de tecnologias de rastreabilidade adicionais, como marcas de água digitais visíveis ou invisíveis, técnicas de impressão digital de hash ou de impressão digital, para detetar a utilização não autorizada após o facto e para apoiar potenciais acções judiciais.
A adoção precoce de um mecanismo eficaz de auto-exclusão não só preserva os direitos contra a utilização não autorizada na formação em IA, como também reforça a posição negocial para futuros pedidos de licença, regimes de compensação ou litígios legais.
Num ambiente regulamentar em evolução, uma estratégia proactiva e tecnicamente sólida será fundamental para proteger o valor dos conteúdos.
Nota informativa redigida pela área de TMT da ECIJA Madrid.