O Google lançou o SynthID Text, uma tecnologia inovadora que permite que textos gerados por inteligência artificial (IA) sejam marcados com marcas d'água invisíveis. Essa ferramenta, que agora está disponível gratuitamente e em código aberto para desenvolvedores, busca promover o desenvolvimento ético de sistemas automatizados, fornecendo uma solução para diferenciar o conteúdo criado por IA do conteúdo produzido por humanos.
Marcas d'água para combater a desinformação
A empresa de Mountain View acredita que identificar o conteúdo gerado por IA é essencial para evitar seu uso indevido. "A IA pode gerar uma ampla gama de conteúdo em uma escala sem precedentes", observa o Google. Embora a maioria dessas criações seja para usos legítimos, há preocupações sobre seu potencial de disseminação de informações errôneas e complicação da atribuição de direitos autorais. O Google desenvolveu o SynthID Text como uma forma de mitigar esses riscos. Já em anos anteriores, o Google implementou sistemas de identificação para imagens e vídeos, e esse novo avanço no texto marca uma etapa importante na contenção de possíveis usos mal-intencionados da tecnologia de IA.
A marca d'água de texto é mais desafiadora do que a marca d'água de imagens ou vídeos, pois o idioma exige uma seleção precisa de palavras. O Google inovou ao implementar esse tipo de "selos digitais" no texto produzido por IA, marcando um avanço no setor. De acordo com Scott Aaronson, especialista em ciência da computação da Universidade do Texas em Austin, "o mais relevante é que esse sistema está finalmente sendo colocado em prática".
Funcionamento e limitações do SynthID Text
O sistema funciona comparando a probabilidade de determinados tokens ou palavras em textos com e sem marca d'água. Esse mecanismo permite que o algoritmo identifique se uma parte do conteúdo foi gerada por IA, analisando as variações na seleção de palavras. O SynthID Text usa uma chave criptográfica para atribuir pontuações a cada palavra e seleciona a opção com o valor mais alto, garantindo que a marca seja difícil de apagar ou alterar. Em testes na plataforma Gemini, o Google demonstrou que o SynthID Text não afeta a qualidade ou a precisão dos modelos de linguagem.
Apesar de seus avanços, o SynthID Text ainda tem dificuldades para identificar textos curtos, reescritos ou traduzidos, pois os modelos de idioma são quase determinísticos em suas respostas. No entanto, especialistas como Soheil Feizi, da Universidade de Maryland, destacam que essa ferramenta oferece à comunidade um recurso útil para avaliar a robustez dos detectores de conteúdo gerados por IA, contribuindo para uma compreensão mais profunda das limitações e dos recursos dessas tecnologias.