A empresa de inteligência artificial Anthropic anunciou nesta sexta-feira a desativação de dois modelos de IA que havia lançado anteriormente na semana, o Claude Fable 5 e o Mythos 5, para cumprir uma diretriz de controle de exportação recebida do governo dos EUA por preocupações com a segurança nacional.
O incidente sem precedentes marca o mais recente ponto de tensão entre a Anthropic e a administração Trump. Segundo a empresa, a ordem solicitou a suspensão do acesso a qualquer cidadão estrangeiro, seja dentro ou fora dos Estados Unidos, incluindo funcionários estrangeiros da Anthropic. No entanto, a empresa removeu o acesso para todos os seus clientes para garantir o cumprimento total da determinação governamental.
Mais cedo neste ano, o Departamento de Defesa de Trump rotulou a Anthropic como um "risco para a cadeia de suprimentos" após a criadora do Claude tentar estabelecer limites sobre como o militares americano poderiam usar sua tecnologia. Essa designação efetivamente impediu agências governamentais e contratantes de usar a tecnologia da Anthropic. A empresa respondeu entrando com processos judiciais contra a administração Trump.
Na terça-feira, a Anthropic lançou publicamente o Claude Fable 5, uma versão do modelo de IA Mythos da empresa com salvaguardas que impedem o modelo de responder perguntas sobre cibersegurança, biologia e química. Antes do lançamento público, que a empresa disse ter conduzido em colaboração com o governo dos EUA, o modelo de IA Mythos Preview teve um lançamento limitado em abril. O objetivo era dar a empresas e organizações a oportunidade de usar suas poderosas capacidades de cibersegurança para melhorar suas defesas e reduzir preocupações de que a tecnologia pudesse ser explorada por atores mal-intencionados para desenvolver poderosas ferramentas de hacking.
Em uma publicação em seu blog na sexta-feira, a Anthropic afirmou ter recebido uma carta do governo dos EUA às 17h21 (horário do leste). "A carta não forneceu detalhes específicos sobre sua preocupação com a segurança nacional", escreveu a empresa. "Nossa compreensão é que o governo acredita ter tomado conhecimento de um método de contornar, ou 'fazer jailbreak' do Fable 5."
A empresa añadió que revisou uma demonstração dessa técnica específica sendo usada para identificar um pequeno número de vulnerabilidades menores previamente conhecidas. Todas essas vulnerabilidades parecem relativamente simples, e a empresa descobriu que outros modelos disponíveis publicamente são capazes de descobri-las sem necessidade de uma contorno.
Na publicação, a empresa argumentou que implementou salvaguardas fortes para reduzir a probabilidade de uso indevido do Claude Fable 5. A Anthropic também afirmou que o jailbreak que o governo dos EUA encontrou para o Claude Fable 5 era limitado e não tornaria um atacante significativamente mais perigoso do que seria com outro modelo de IA.
"Até agora, o governo nos forneceu apenas evidências verbais de um possível jailbreak limitado, não universal, que essencialmente consiste em pedir ao modelo para ler uma base de código específica e corrigir quaisquer falhas de software", disse a empresa em seu blog. "Nossa compreensão é que uma potencial técnica de jailbreak foi compartilhada com o governo."
Porta-vozes da Casa Branca e do Departamento de Comércio dos EUA não responderam imediatamente ao pedido de comentário da WIRED.
O CEO da Anthropic, Dario Amodei, disse em um ensaio de política mais cedo nesta semana que ele e a empresa apoiam um processo governamental justo, estruturado e transparente que bloquearia a liberação de modelos de IA inseguros. Na publicação da empresa na sexta-feira, a Anthropic argumentou que "esta ação não adere a esses princípios".
Fonte: Feed: All Latest
