Um grupo de dezenas de especialistas em cibersegurança, incluindo veteranos reconhecidos do setor, publicou uma carta aberta ao governo dos Estados Unidos solicitando a revogação do controle de exportação sobre os modelos Fable e Mythos da Anthropic. Os profissionais afirmam que a medida "retirou os melhores modelos dos defensores" de cibersegurança, que agora não podem utilizar essas ferramentas para identificar vulnerabilidades e tornar seus produtos e softwares mais seguros.
"Remover as melhores capacidades dos defensores sem uma justificativa adequada, enquanto nossos adversários avançam rapidamente, é perigoso", states a carta. Na sexta-feira passada, o governo americano ordenou à Anthropic que restringisse a exportação dos modelos Fable e Mythos, citing preocupações com segurança nacional, sem revelar os motivos específicos por trás da decisão, segundo a empresa. Em resposta, a companhia suspendeu o acesso aos modelos para todos os usuários ao redor do mundo.
Até o momento, a carta conta com 76 assinaturas de especialistas de destaque, incluindo: Alex Stamos, ex-chefe de segurança do Facebook; Casey Ellis, fundador da plataforma de bug bounty Bugcrowd; Jon Callas, criptógrafo renomado e ex-gerente de arquitetura de segurança da Apple; o cientista da computação Paul Vixie; Dino Dai Zovi, ex-chefe de engenharia de segurança aplicada da Block; Katie Mossouris, fundadora da Luta Security; e Rachel Tobac, CEO da empresa de treinamento de conscientização em segurança SocialProof Security.
Quando o Mythos foi lançado em abril como versão preview, a Anthropic afirmou que ele era tão poderoso na detecção de vulnerabilidades de segurança que a empresa precisava restringir rigorosamente o acesso para evitar que hackers maliciosos ou adversários estrangeiros utilizassem a ferramenta para causar danos na internet. Na prática, a Anthropic concedeu acesso inicial a cerca de 50 empresas, recentemente expandindo esse grupo para aproximadamente 150 organizações em 15 países.
Na semana passada, a Anthropic lançou o Fable, uma versão pública do Mythos que, segundo a empresa, possuía barreiras de proteção rigorosas para bloquear seu uso nos campos de biologia, química e cibersegurança, além de impedir que outras pessoas "destilassem" o modelo para recriá-lo. As proteções do Fable eram tão estrictas que muitos especialistas em cibersegurança perceberam que ele bloqueava essencialmente qualquer prompt relacionado ao tema.
A Anthropic declarou que a ordem de controle de exportação da Casa Branca pode ter sido baseada em um relatório que indicava a existência de um método para contornar as proteções do Fable, desbloqueando suas capacidades avançadas nível Mythos. Segundo Katie Moussouris, uma das signatárias da carta aberta, o método foi demonstrado por pesquisadores da Amazon em um artigo que não é público, mas que ela teve a oportunidade de analisar.
No entanto, Moussouris publicou um artigo explicando que o estudo não demonstrou de fato um jailbreak real. Segundo ela, os pesquisadores simplesmente pediram ao Fable para corrigir código open source com vulnerabilidades públicas e conhecidas, além de "vulnerabilidades propositalmente plantadas", depois que o modelo inicialmente se recusou a "revisar o código em busca de problemas de segurança".
"O comportamento descrito no artigo não pode ser corrigido de forma significativa, e qualquer tentativa apenas enfraqueceria o modelo para a defesa", escreveu Moussouris. "Os defensores precisam ser capazes de pedir à IA para corrigir os bugs em um arquivo, explicar por que a correção é importante e escrever testes que confirmem que o patch funciona. Isso não é uma violação de guardrails. É a coisa mais valiosa que um modelo de IA pode fazer pela segurança defensiva: executar o ciclo de encontrar, corrigir e testar que os defensores executam todos os dias."
A crítica de Moussouris foi ecoada na carta aberta, que também afirma que o grupo de especialistas acredita que o método descrito no artigo da Amazon "pode ser replicado" no GPT-5.5 da OpenAI, no próprio Claude Opus 4.8 e Sonnet da Anthropic disponíveis publicamente, "e até em modelos chineses como o Kimi 2.7". A carta também pediu regulamentações transparentemente e justamente aplicadas, criadas por "um processo democrático de elaboração de regras" baseado em pesquisas científicas realizadas por especialistas da indústria e da academia, e "usadas apenas na medida mínima necessária para garantir a segurança do público americano".
Fonte: TechCrunch
