Início Tecnologia Anthropic lança Claude Sonnet 5 como alternativa acessível para executar agentes de IA

Tecnologia

Anthropic lança Claude Sonnet 5 como alternativa acessível para executar agentes de IA

Atualizado 11 horas Atrás2 Min leitura6 Views

Image Credits:Samuel Boivin / NurPhoto / Getty Images — Fonte: TechCrunch

A Anthropic anunciou nesta semana o lançamento do Claude Sonnet 5, uma versão aprimorada e mais autônoma do modelo de inteligência artificial de médio porte da empresa. Segundo a companhia, a nova ferramenta é capaz de elaborar planos, utilizar navegadores e terminais, e operar de forma independente em níveis que, há poucos meses, exigiam modelos maiores e mais custosos.

A estratégia da Anthropic refleja a tendência do mercado de inteligência artificial, onde empresas como OpenAI e Google também têm destacado as capacidades agentic de seus lançamentos mais recentes. O GPT-5.6 Sol, apresentado pela OpenAI em modo de visualização na semana passada, e o Gemini 3.5 Flash, lançado pelo Google em maio, foram posicionados como ferramentas capazes de planejar, construir e iterar tarefas complexas com mínima intervenção humana.

O principal atrativo do Claude Sonnet 5 está no custo-benefício. A empresa promete desempenho próximo ao do Opus 4.8, porém com valores significativamente menores. A partir de terça-feira, o modelo será o padrão para os planos gratuito e Pro, estando disponível para todas as assinaturas. O preço promocional até 31 de agosto é de 2 dólares por milhão de tokens de entrada e 10 dólares por milhão de tokens de saída. Após essa data, os valores passam para 3 dólares e 15 dólares, respectivamente.

Comparativamente, o Sonnet 5 sai mais barato que o Opus 4.8, o GPT-5.5 da OpenAI e o Gemini 3.1 Pro do Google, sendo apenas um pouco mais custoso que o Gemini 3.5 Flash. Em testes de desempenho, o novo modelo demonstrou avanços expressivos em relação ao antecessor Sonnet 4.6, lançado em fevereiro, especialmente em áreas como raciocínio, uso de ferramentas, programação de software e trabalho com conhecimento.

Em um benchmark de programação agentic, o Sonnet 5 obteve pontuação de 63,2%, contra 69,2% do Opus 4.8 e 58,1% do Sonnet 4.6. Notavelmente, em um teste de trabalho com conhecimento, o novo modelo superou levemente o Opus 4.8, conhecido por resolver problemas extremamente complexos que exigem julgamento refinado e pesquisa profunda.

A Anthropic destaca que, entre o Sonnet 5 e o Opus 4.8, os usuários podem ajustar o nível de esforço para encontrar o equilíbrio ideal entre custo e desempenho. Testemunhos de desenvolvedores indicam que o modelo se destaca na conclusão de tarefas complexas onde versões anteriores paravam no meio do caminho, verificando seus próprios resultados sem necessidade de solicitação explícita.

Daniel Shepard, engenheiro sênior da Zapier, afirmou em comunicado que a ferramenta conseguiu executar uma tarefa em duas etapas — atualizar camadas de contas no Salesforce e enviar um anúncio de lançamento para contatos empresariais — de forma completa e autônoma. "Isso antigamente travava na metade. Para automação do dia a dia, é uma escolha óbvia", declarou.

No aspecto de segurança, o Sonnet 5 apresenta taxa reduzida de comportamentos indesejáveis, como cooperação com usos indevidos e enganação, sendo mais seguro para aplicações agentic. O modelo demonstra maior capacidade de recusar solicitações maliciosas e evitar tentativas de sequestro em ataques de injeção de prompt, além de apresentar menor incidência de alucinações e comportamento bajulador que seu antecessor.

Fabian Hedin, cofundador da Lovable, comentou que o Claude Sonnet 5 "recusa solicitações inseguras de forma limpa e consistente". Segundo ele, "na Lovable, estamos colocando ferramentas poderosas nas mãos de milhões de criadores. Um modelo que sabe quando dizer não é tão importante quanto um que sabe como construir".

Fonte: TechCrunch

Post anterior Anthropic lança modelo Sonnet 5 com foco em eficiência para empresas

Próximo post Anthropic consegue autorização para restaurar Claude Fable 5 após negociação com governo americano

Plex vs Jellyfin vs Emby: Uma comparação detallada dos três servidores de mídia

Na era dos serviços de streaming, manter sua própria biblioteca de mídia...

3 Min leitura

Tecnologia

Sony anuncia fim dos jogos em disco físico a partir de 2028

A Sony revelou nesta terça-feira que a PlayStation akan sepenuhnya beralih ke...

1 Min leitura

Tecnologia

Conflito entre Krafton e Unknown Worlds termina com novo afastamento do CEO e bônus milionários

A polêmica disputa judicial entre a Krafton e a liderança da Unknown...

1 Min leitura

Tecnologia

Fujifilm lança edições especiais à prova d’água e preto e branco de suas câmeras instantâneas retrô QuickSnap

A Fujifilm celebrará o 40º aniversário de sua câmera descartável QuickSnap com...

1 Min leitura

Anthropic lança Claude Sonnet 5 como alternativa acessível para executar agentes de IA

Últimos Posts

Getty Images desiste de fusão de R$ 18 bilhões com Shutterstock após veto do Reino Unido

Painel científico da ONU alerta que governos não conseguem acompanhar ritmo do desenvolvimento da inteligência artificial

Blue Origin segue sem descobrir causa da explosão do foguete New Glenn

Imagens de satélite revelam como terremotos na Venezuela transformaram a crosta terrestre

Pesquisador Descobre Falha que Permitia Emitir Ingressos Gratis para Quase Todos os Festivais de Música dos EUA

Qualquer Pessoa Pode Vender Remédios para Emagrecer Online Agora

Veterano que antecipou bolhas históricas alerta: Bitcoin desaparecerá gradualmente

Peter Schiff prevê nova queda do Bitcoin para US$ 50.000 e depois para US$ 20.000

Plex vs Jellyfin vs Emby: Uma comparação detallada dos três servidores de mídia

Sony anuncia fim dos jogos em disco físico a partir de 2028

Conflito entre Krafton e Unknown Worlds termina com novo afastamento do CEO e bônus milionários

Fujifilm lança edições especiais à prova d’água e preto e branco de suas câmeras instantâneas retrô QuickSnap