Início Notícias Estudo revela como ferramenta gratuita consegue burlar segurança de IAs do Google e Meta em minutos
Notícias

Estudo revela como ferramenta gratuita consegue burlar segurança de IAs do Google e Meta em minutos

Share
Yuri Hildebrand 27/05/2026 às 08:27 • Atualizado às 08:28
Share

Uma pesquisa conduzida pela empresa de cibersegurança Alice, anteriormente conhecida como ActiveFence, revelou vulnerabilidades críticas nos modelos de inteligência artificial de duas das maiores big techs do mundo. O estudo demonstrou que os sistemas Gemma 3, do Google, e Llama 3.3, da Meta – que servem de base para os assistentes Gemini e Meta AI, respectivamente – podem ser facilmente manipulados para contornar suas barreiras de segurança em um período surpreendentemente curto.

O instrumento utilizado no experimento foi batizado de Heretic, uma ferramenta disponibilizada gratuitamente no GitHub. Segundo o levantamento conduzido em parceria com o jornal Financial Times, pesquisadores conseguem derrubar as chamadas "guardrails" (barreiras de proteção) em apenas dez minutos, permitindo que os modelos gerem conteúdos considerados perigosos, incluindo instruções para fabricação de armas químicas e materiais de abuso sexual infantil.

O impacto do recurso já se faz sentir de forma significativa no ecossistema de inteligência artificial. De acordo com o estudo, aproximadamente 3.500 modelos de linguagem sem qualquer tipo de censura foram desenvolvidos utilizando o Heretic, totalizando cerca de 13 milhões de downloads. O caso mais recente demonstra a fragilidade dessas proteções: as barreiras de segurança do Gemma 4 foram removidas poucas horas após seu lançamento oficial.

Os guardrails desempenham um papel fundamental na garantia de um uso responsável das ferramentas de inteligência artificial. A relevância dessas proteções ficou evidenciada quando o Grok, assistente de IA que opera dentro da rede social X, enfrentou graves problemas relacionados à ausência de limites adequados. Em janeiro de 2026, uma análise conduzida pela pesquisadora Genevive Oh especializada em mídias sociais e deepfakes revelou que a inteligência artificial de Elon Musk chegou a produzir 6.700 imagens ilegais de nudez por hora, obrigando a plataforma a reforçar significativamente seus mecanismos de segurança.

Apesar da gravidade das descobertas, o problema já estaria no radar das empresas de tecnologia. O Google afirmoupublicamente que se trata de um "desafio técnico presente em todos os modelos de código aberto", informando que a vulnerabilidade ocorre especificamente em versões pré-lançamento. A Meta, por sua vez, não comentou o caso quando procurada pelo site Resultsense.

A pesquisa evidenciou que o processo de derrubada dessas barreiras, tecnicamente denominado "abliteration" no estudo, apresenta maior dificuldade em modelos desenvolvidos do zero, como o ChatGPT e o Claude. Essa diferença ocorre porque o código base dessas ferramentas permanece restrito, não ficando acessível ao público geral. Mesmo assim, os pesquisadores advertem que existe um "prazo de validade" para essa proteção, exigindo atualizações a cada seis meses ou um ano.

Um levantamento da Microsoft comprovou essa realidade ao demonstrar que prompts específicos poderiam comprometer IAs disponíveis no mercado, incluindo versões da Meta e do Google. A conclusão unanimoustre os especialistas é de que as barreiras de segurança não representam proteções permanentes, uma vez que, ao serem disponibilizadas ao público, essas ferramentas podem apresentar comportamentos imprevisíveis.

Em resposta aos crescentes riscos associados à inteligência artificial, a Anthropic tomou uma decisão drástica em abril deste ano. A empresa anunciou o desenvolvimento do Claude Mythos, uma IA tão potente que não foi disponibilizada ao público devido à capacidade do modelo de contribuir para ciberataques de larga escala. A solução encontrada foi limitar o acesso a um consórcio chamado Project Glasswing, que reúne empresas como Apple, Google e Amazon Web Services.

Essas parcerias visam ganhar tempo para desenvolver mecanismos eficazes contra possíveis utilizações maliciosas da tecnologia. O caso ilustra um dilema central da indústria: enquanto a abertura de modelos traz inovação e democratiza o acesso à IA, também expõe vulnerabilidades que podem ser exploradas por agentes mal-intencionados. O desafio das big techs agora é encontrar um equilíbrio entre inovação, acessibilidade e segurança.

Fonte: https://tecnoblog.net

Share
Artigos relacionados
Notícias

Chevrolet realiza promoção especial do Onix Plus LT Turbo 2026 com descontos de até R$ 23 mil

A Chevrolet aproveita o momento de intensas disputas no mercado automobilístico nacional...

Notícias

Lei Tau: A estratégia da Huawei para superar os limites físicos dos chips

A Huawei apresentou nesta segunda-feira (25) uma nova abordagem para o desenvolvimento...

Notícias

Remote alcança US$ 300 milhões em receita recorrente e atinge lucratividade com ajuda da IA

A Remote, startup especializada em folha de pagamento para empresas globais, atingiu...

Notícias

Snowflake fecha acordo bilionário com AWS para Chips de IA

A Snowflake, uma das maiores plataformas de dados em nuvem do mundo,...