Cinco programas para o proteger dos formadores de IA

Artigo22 de abril de 2026

Partilhar

Orientações jurídicas e técnicas para proteger as obras contra a formação não autorizada de inteligência artificial.

A utilização de imagens disponíveis na Internet para treinar modelos de inteligência artificial (IA) mantém viva a tensão entre programadores e criadores. Embora o debate jurídico continue, especialmente na União Europeia (UE), a realidade técnica é clara: qualquer ficheiro publicado é vulnerável à extração de dados, a menos que tenha restrições explícitas e medidas de segurança reconhecíveis. Até 2026, a proteção de uma obra já não dependerá de uma marca de água invisível. As soluções mais eficazes combinam autenticação criptográfica, registos de exclusão, protocolos de controlo de scraping e garantias legais para a extração de texto e dados (ETD).

Analisamos as cinco ferramentas e quadros que definem o estado atual da proteção dos criadores contra o treino não autorizado de IA, incorporando a perspetiva jurídica de Juan Carlos Guerrero, sócio de Propriedade Intelectual e Tecnologia da ECIJA.

Credenciais de conteúdo

Desenvolvidas pela Adobe como parte da norma Coalition for Content Provenance and Authenticity (C2PA), permitem a incorporação de metadados criptográficos verificáveis que indicam a autoria, o histórico de edição e as preferências de utilização, incluindo a opção/etiqueta "Não treinar". Ao contrário das marcas de água invisíveis tradicionais, integram assinaturas digitais e impressões digitais criptográficas numa norma adoptada por meios de comunicação e plataformas. Não impedem a cópia, mas deixam uma marca verificável. Guerrero salienta que estas credenciais "melhoram a rastreabilidade e podem ser decisivas para demonstrar que o criador foi capaz de identificar os direitos reservados".

Na prática, são úteis para fotógrafos, marcas e profissionais que trabalham em ambientes compatíveis com a C2PA. O Safe Creative, reconhecido como validador oficial desde o final de 2025, incorpora o logótipo CR nas obras registadas, permitindo aos utilizadores verificar informações sobre autenticidade, origem e edição.

Registo de Exclusão do Spawning

A plataforma Spawning promove o Registo "Do Not Train" e a ferramenta "Have I Been Trained?", que permite aos utilizadores verificar se uma imagem aparece em conjuntos de dados específicos. A sua principal função é permitir que os criadores expressem a sua oposição e que os programadores consultem esta informação antes de treinar modelos. No entanto, o especialista salienta que estes sistemas "não substituem a exceção de retirada prevista na legislação europeia", mas reforçam "a visibilidade e a rastreabilidade da oposição do titular do direito".

Em Espanha, o regime de exploração de textos e dados foi introduzido pelo Real Decreto Lei 24/2021 e permite a utilização lícita de obras acessíveis para ETD, a menos que o titular dos direitos se oponha expressamente. Por este motivo, a simples inclusão num registo privado não é suficiente. É essencial formular uma objeção inequívoca que seja legível por sistemas automatizados. A Spawning promove também o protocolo ai.txt, uma evolução do clássico robots.txt adaptado à IA, que informa os sistemas de rastreio sobre os conteúdos que não podem ser utilizados para treino.

ImageSentinel

Trata-se de uma estrutura de investigação destinada a proteger grandes colecções de imagens de modelos generativos. Em vez de simplesmente assinalar ficheiros individuais, introduz imagens "sentinela" em conjuntos de dados para detetar se foi incorporado material não autorizado. Não impede a utilização, mas pode fornecer provas relevantes em caso de litígio. Embora ainda esteja na fase académica, é de interesse para bancos de imagens, arquivos institucionais e grandes repositórios.

Ferramentas avançadas de perturbação

Investigação recente, como a conduzida pela Organização de Investigação Científica e Industrial da Commonwealth (CSIRO), explora métodos que alteram subtilmente os pixels das imagens para que os sistemas de IA aprendam representações distorcidas durante o treino, imperceptíveis ao olho humano.

Este tipo de técnicas são conhecidas como defesas adversárias e representam um avanço em relação às gerações anteriores de "ruído anti-IA", que agora são facilmente neutralizadas por processos automatizados. No entanto, requerem conhecimentos técnicos para serem aplicadas e não garantem a exclusão do treino.

protocolo ai.txt

Integra-se no servidor e permite a declaração automática de que o conteúdo não pode ser utilizado para formação ou "afinação" (formação adicional para especializar modelos para tarefas específicas). Embora não bloqueie downloads não autorizados nem garanta a conformidade legal, pode ser relevante numa eventual avaliação jurídica. Guerrero salienta que o que importa é que a "objeção seja inequívoca e legível por máquinas. Se o programador não conseguir identificar razoavelmente a restrição, será mais fácil para ele invocar a exceção TDM. Por conseguinte, não se trata de uma fortaleza, mas sim de um sinal técnico para demonstrar que a objeção era detetável por processos automatizados.

Que ferramentas são deixadas para trás?

Os sistemas de marcas de água invisíveis de primeira geração, como o projeto NO AI, ou os serviços Web básicos, como o primeiro ArtShield Watermarker, são agora insuficientes se utilizados isoladamente. A estratégia de passar uma imagem por modelos gerados por IA para que os modelos a rejeitem perdeu a sua eficácia contra sistemas de IA mais avançados. Ferramentas como o Glaze e o Nightshade, que eram disruptivas em 2023, tiveram de evoluir para se adaptarem a modelos mais resistentes a simples interferências. A sua utilidade atual é dissuasora e depende da utilização de versões recentes combinadas com outros mecanismos de proteção, como os direitos de autor legais.

O que fazer se a obra fizer parte de um conjunto de dados de treino?

Atualmente, não existe um mecanismo automático que garanta a remoção de uma obra incluída num conjunto de dados de treino. No entanto, a deteção pelos criadores é crucial: embora "não gere automaticamente um direito a indemnização, constitui uma prova fundamental se for integrada numa estratégia jurídica mais ampla", afirma Guerrero. As medidas a tomar incluem:

Formulação ou reforço da exceção à prospeção de texto e dados.
Envio de pedidos de retirada ou exclusão.
Exploração de acções judiciais por violação de direitos de autor ou concorrência desleal, especialmente se uma reserva válida for ignorada.

Quanto à compensação económica, também não existe um sistema geral de remuneração obrigatória para a formação em IA; depende de acordos voluntários, licenças específicas ou litígios individuais em que a infração é demonstrada.

Recomendações

Num ambiente de modelo multimodal capaz de aprender a partir de imagens, texto e vídeo, a proteção contra a formação não autorizada deixou de ser uma ação pontual para se tornar uma estratégia global.

É sabido que as medidas técnicas funcionam melhor quando são combinadas e acompanhadas de uma estratégia jurídica e documental coerente. Existe uma diferença clara entre aqueles que publicam sem uma estratégia e aqueles que combinam uma oposição legal explícita com um sinal técnico legível por máquina e medidas de rastreabilidade", defende Guerrero. Um primeiro passo é registar o processo criativo das obras, desde os esboços até ao resultado final, em serviços como o Safe Creative, que permite demonstrar a autoria em caso de litígio. Além disso, ao registar-se, esta plataforma inclui a opção de o autor registar a sua objeção à utilização do seu trabalho para fins de formação, acrescentando um nível extra de proteção.

O advogado insiste no facto de que: a estratégia correta não é tentar tornar a obra invisível, mas sim dificultar o argumento de que o sistema automatizado não identificou os direitos reservados do titular dos direitos". O facto é que, num ambiente em que o estilo é identidade e valor económico, a sua proteção exige o mesmo profissionalismo com que é criado.