Início Tecnologia Casa Branca exige que Anthropic bloqueie jailbreaks, mas especialistas dizem ser impossível
Tecnologia

Casa Branca exige que Anthropic bloqueie jailbreaks, mas especialistas dizem ser impossível

Share
Fonte: Feed: All Latest
Share

A administração Trump intensificou a pressão sobre a Anthropic para que a empresa impeça qualquer forma de desvio de segurança em seus modelos de inteligência artificial mais avançados. Segundo fontes da administração ouvidas pela Inner Loop, caso a empresa Deseje relançar o modelo Claude Fable 5, será necessário garantir que as barreiras de proteção não possam ser contornadas.

A Anthropic tem reiterado nos últimos dias que as preocupações do governo são exageradas e que os efeitos dos jailbreaks são mínimos. A empresa defendeu essa posição em reunião técnica realizada na segunda-feira com o Departamento de Comércio e o Escritório do Diretor Nacional de Ciburança, Sean Cairncross.

No entanto, os oficiais afirmam que já passaram do ponto de discutir se os jailbreaks são significativos, uma vez que a Agência de Segurança Nacional concluiu que existem maneiras de desativar as barreiras de proteção do Fable 5. Essas barreiras foram implementadas para impedir que usuários acessem capacidades do modelo Mythos relacionadas a cibersegurança, química e biologia.

Neste estágio, a administração essentially considera que a solução do problema é responsabilidade da Anthropic, de acordo com três pessoas familiarizadas com as discussões. Nem o Centro de Padrões e Inovação de IA do Departamento de Comércio nem a Agência de Segurança Nacional possuem equipe suficiente para perseguir todos os jailbreaks imagináveis em todos os modelos que chegam ao mercado.

Como resultado, a administração acredita que a Anthropic deve ser mais proativa em testar continuamente não apenas o Fable 5, mas todos os seus modelos de IA de fronteira para encontrar potenciais desvios de segurança e reportá-los ao governo.

Mas em um nível mais fundamental, permanece unclear how a Anthropic deveria prevenir jailbreaks. Especialistas independentes em cibersegurança têm cada vez mais adotado a visão de que as barreiras de proteção em modelos de IA são apenas uma solução temporária, já que usuários habilidosos e modelos futuros de IA encontrarão maneiras de contornar restrições.

Paralelamente, uma disputa política envolve a indicação para Diretor de Inteligência Nacional. Trump inicialmente nomeou Bill Pulte, seu chefe de financiamento habitacional, para substituir a diretora Tulsi Gabbard. Diante da resistência bipartidária devido à falta de experiência de Pulte em segurança nacional, Trump anunciou Jay Clayton, promotor dos Estados Unidos para o Distrito Sul de Nova York, como candidato permanente.

Na quarta-feira, Trump exploded o plano ao anunciar que a audiência de Clayton seria adiada indefinidamente, em uma aparente tentativa de impedir que Pulte fosse ultrapassado. Senadores republicanos anunciaram então que a audiência prosseguiria, a menos que Clayton não comparecesse ou sua indicação fosse retirada.

Na semana passada, a Inner Loop relatou que auxiliares da Casa Branca esperavam uma multidão de doadores e executivos presentes no evento UFC Freedom 250 para se aproximarem de Trump e autoridades seniores da administração. Entre os participantes notáveis estavam o CEO da Paramount, David Ellison, que obteve aprovação do Departamento de Justiça para adquirir a Warner Bros Discovery, e o CEO da Meta, Mark Zuckerberg, que foi visto conversando com Trump.

Fonte: Feed: All Latest

Share
Artigos relacionados
Tecnologia

Promessa surpreendente: computação quântica com correção de erros pode estar disponível em 2028

O setor de computação quântica tradicionalmente concentra seus anúncios de progresso perto...

Tecnologia

Allbirds se transforma em Smartbird e aposta em infraestrutura de IA com nova CEO

A Allbirds, conhecida internacionalmente por seus tênis sustentáveis, passou por uma transformação...

Tecnologia

Oracle nega que acordo de US$ 3 bilhões com Microsoft tenha fracassado por questões de segurança

A Oracle rejeitou nesta terça-feira os relatórios que indicavam que as negociações...

Tecnologia

Echo Dot Max tem desconto histórico em promoção antecipada do Prime Day

Os consumidores brasileiros podem aproveitar uma oportunidade imperdível com os primeiros descontos...