Início Notícias Estudo revela como ferramenta gratuita consegue burlar segurança de IAs do Google e Meta em minutos

Notícias

Estudo revela como ferramenta gratuita consegue burlar segurança de IAs do Google e Meta em minutos

Atualizado 2 meses Atrás3 Min leitura59 Views

Yuri Hildebrand 27/05/2026 às 08:27 • Atualizado às 08:28

Uma pesquisa conduzida pela empresa de cibersegurança Alice, anteriormente conhecida como ActiveFence, revelou vulnerabilidades críticas nos modelos de inteligência artificial de duas das maiores big techs do mundo. O estudo demonstrou que os sistemas Gemma 3, do Google, e Llama 3.3, da Meta – que servem de base para os assistentes Gemini e Meta AI, respectivamente – podem ser facilmente manipulados para contornar suas barreiras de segurança em um período surpreendentemente curto.

O instrumento utilizado no experimento foi batizado de Heretic, uma ferramenta disponibilizada gratuitamente no GitHub. Segundo o levantamento conduzido em parceria com o jornal Financial Times, pesquisadores conseguem derrubar as chamadas "guardrails" (barreiras de proteção) em apenas dez minutos, permitindo que os modelos gerem conteúdos considerados perigosos, incluindo instruções para fabricação de armas químicas e materiais de abuso sexual infantil.

O impacto do recurso já se faz sentir de forma significativa no ecossistema de inteligência artificial. De acordo com o estudo, aproximadamente 3.500 modelos de linguagem sem qualquer tipo de censura foram desenvolvidos utilizando o Heretic, totalizando cerca de 13 milhões de downloads. O caso mais recente demonstra a fragilidade dessas proteções: as barreiras de segurança do Gemma 4 foram removidas poucas horas após seu lançamento oficial.

Os guardrails desempenham um papel fundamental na garantia de um uso responsável das ferramentas de inteligência artificial. A relevância dessas proteções ficou evidenciada quando o Grok, assistente de IA que opera dentro da rede social X, enfrentou graves problemas relacionados à ausência de limites adequados. Em janeiro de 2026, uma análise conduzida pela pesquisadora Genevive Oh especializada em mídias sociais e deepfakes revelou que a inteligência artificial de Elon Musk chegou a produzir 6.700 imagens ilegais de nudez por hora, obrigando a plataforma a reforçar significativamente seus mecanismos de segurança.

Apesar da gravidade das descobertas, o problema já estaria no radar das empresas de tecnologia. O Google afirmoupublicamente que se trata de um "desafio técnico presente em todos os modelos de código aberto", informando que a vulnerabilidade ocorre especificamente em versões pré-lançamento. A Meta, por sua vez, não comentou o caso quando procurada pelo site Resultsense.

A pesquisa evidenciou que o processo de derrubada dessas barreiras, tecnicamente denominado "abliteration" no estudo, apresenta maior dificuldade em modelos desenvolvidos do zero, como o ChatGPT e o Claude. Essa diferença ocorre porque o código base dessas ferramentas permanece restrito, não ficando acessível ao público geral. Mesmo assim, os pesquisadores advertem que existe um "prazo de validade" para essa proteção, exigindo atualizações a cada seis meses ou um ano.

Um levantamento da Microsoft comprovou essa realidade ao demonstrar que prompts específicos poderiam comprometer IAs disponíveis no mercado, incluindo versões da Meta e do Google. A conclusão unanimoustre os especialistas é de que as barreiras de segurança não representam proteções permanentes, uma vez que, ao serem disponibilizadas ao público, essas ferramentas podem apresentar comportamentos imprevisíveis.

Em resposta aos crescentes riscos associados à inteligência artificial, a Anthropic tomou uma decisão drástica em abril deste ano. A empresa anunciou o desenvolvimento do Claude Mythos, uma IA tão potente que não foi disponibilizada ao público devido à capacidade do modelo de contribuir para ciberataques de larga escala. A solução encontrada foi limitar o acesso a um consórcio chamado Project Glasswing, que reúne empresas como Apple, Google e Amazon Web Services.

Essas parcerias visam ganhar tempo para desenvolver mecanismos eficazes contra possíveis utilizações maliciosas da tecnologia. O caso ilustra um dilema central da indústria: enquanto a abertura de modelos traz inovação e democratiza o acesso à IA, também expõe vulnerabilidades que podem ser exploradas por agentes mal-intencionados. O desafio das big techs agora é encontrar um equilíbrio entre inovação, acessibilidade e segurança.

Fonte: https://tecnoblog.net

Post anterior Bitcoin recua para US$ 75 mil sob pressão de commodities e cautela macroeconômica

Próximo post Samsung reformula nomenclatura dos dobráveis com novo Galaxy Z Fold 8

Por que algumas portas USB são roxas e por que são raras nos EUA

Ao conectar um cabo ao computador, você já percebeu que as portas...

2 Min leitura

Notícias

Parker Solar Probe realiza novo sobrevoo do Sol, energia solar conquista avanços e mais notícias da ciência

Esta semana traz consigo uma série de descobertas e desenvolvimentos significativos no...

2 Min leitura

Notícias

Dyson Lança Nova Linha de Aspiradores 2026: V16 Piston Animal, V10 Konical e V8 Cyclone

A Dyson apresenta sua aguardada linha de aspiradores para 2026, trazendo três...

1 Min leitura

Notícias

Apple lança novas ferramentas de edição de fotos com IA no iOS 27

A câmera mais popular do mundo acaba de receber seu primeiro conjunto...

1 Min leitura

Estudo revela como ferramenta gratuita consegue burlar segurança de IAs do Google e Meta em minutos

Últimos Posts

Governo chinês propõe novas regras para combater lavagem de dinheiro com moedas virtuais e alerta para uso de ferramentas de anonimato

Governador do Fed alerta que banco central deve agir rápido contra inflação e mercado de criptomoedas despenca

Blockchain.RIO 2026 apresenta programação com 13 trilhas para debater infraestrutura financeira digital da América Latina

Lenovo Yoga Slim 7i Ultra ou ASUS VivoBook S 14? 💻🤔 #notebook #vivobook #yoga #s14 #slim #qnc

Ryse: Son of Rome poderia se tornar Franchise de várias eras históricas

A Caçada por Gollum recorrerá à inteligência artificial para rejuvenescer elenco icônico após 25 anos

Justiça brasileira condena Microsoft a indenizar gamer por perda de conta Xbox e exigência de recompra de jogos

Blue Box encerra história após cinco anos: mangá de romance e esportes se despede dos fãs da Shonen Jump

Por que algumas portas USB são roxas e por que são raras nos EUA

Parker Solar Probe realiza novo sobrevoo do Sol, energia solar conquista avanços e mais notícias da ciência

Dyson Lança Nova Linha de Aspiradores 2026: V16 Piston Animal, V10 Konical e V8 Cyclone

Apple lança novas ferramentas de edição de fotos com IA no iOS 27