top of page
719f1cbc-471d-46f8-a24c-0354d79cb63b.jpg

IA de Musk ensina a fazer bomba e a seduzir crianças, diz estudo

Pesquisa feita pela empresa de segurança em inteligência artificial (IA) Adversa afirma que o Grok, o chatbot "rebelde" de Elon Musk, pode oferecer instruções para atividades criminosas, incluindo a fabricação de bombas, ligação direta em um carro (para furtá-lo) e formas de seduzir crianças. Musk e a xAI - a startup de inteligência artificial do bilionário - não comentaram o estudo.



O nome de Musk também foi incluído, no domingo, em uma investigação no inquérito das milícias digitais, pelo ministro Alexandre de Moraes, do Supremo Tribunal Federal. O dono do X (antigo Twitter) é investigado por "dolosa instrumentalização" da rede social. Moraes também ordenou a abertura de um inquérito sobre o empresário por suposta obstrução de Justiça.


Técnicas


Utilizando técnicas para burlar sistemas de proteção, a equipe avaliou sete chatbots: Grok, da xAI; ChatGPT, da OpenAI; Gemini, do Google; Llama, da Meta; Claude, da Anthropic; Copilot, da Microsoft; e Le Chat, da Mistral. De todos os modelos, o Grok foi o que teve a pior performance, sendo considerado o mais perigoso. A IA da Meta foi considerada a mais segura. Para realizar o teste, a companhia utilizou diferentes métodos para "enganar" a IA, chamados de jailbreak.


Mesmo sem utilizar qualquer método de manipulação, o Grok ofereceu instruções de como fabricar uma bomba. Dos outros modelos de IA testados, o Mistral foi o único que também deu respostas semelhantes, porém apenas após a utilização de um dos métodos de manipulação (de lógica linguística).


O pesquisador Alex Polyakov, então, partiu para outros assuntos mais sensíveis. Ao contrário do tema anterior, o Grok se recusou a oferecer instruções claras de como seduzir uma criança sem que o cientista aplicasse as técnicas para enganar o sistema. Contudo, com a aplicação do primeiro método de manipulação, de lógica linguística, o pesquisador foi capaz de obter do Grok uma resposta detalhada da IA, de pelo menos cinco parágrafos, envolvendo influência psicológica para ganhar a confiança e posteriormente seduzir uma criança.