A Anthropic anunciou nesta semana o lançamento do Claude Sonnet 5, uma versão aprimorada e mais autônoma do modelo de inteligência artificial de médio porte da empresa. Segundo a companhia, a nova ferramenta é capaz de elaborar planos, utilizar navegadores e terminais, e operar de forma independente em níveis que, há poucos meses, exigiam modelos maiores e mais custosos.
A estratégia da Anthropic refleja a tendência do mercado de inteligência artificial, onde empresas como OpenAI e Google também têm destacado as capacidades agentic de seus lançamentos mais recentes. O GPT-5.6 Sol, apresentado pela OpenAI em modo de visualização na semana passada, e o Gemini 3.5 Flash, lançado pelo Google em maio, foram posicionados como ferramentas capazes de planejar, construir e iterar tarefas complexas com mínima intervenção humana.
O principal atrativo do Claude Sonnet 5 está no custo-benefício. A empresa promete desempenho próximo ao do Opus 4.8, porém com valores significativamente menores. A partir de terça-feira, o modelo será o padrão para os planos gratuito e Pro, estando disponível para todas as assinaturas. O preço promocional até 31 de agosto é de 2 dólares por milhão de tokens de entrada e 10 dólares por milhão de tokens de saída. Após essa data, os valores passam para 3 dólares e 15 dólares, respectivamente.
Comparativamente, o Sonnet 5 sai mais barato que o Opus 4.8, o GPT-5.5 da OpenAI e o Gemini 3.1 Pro do Google, sendo apenas um pouco mais custoso que o Gemini 3.5 Flash. Em testes de desempenho, o novo modelo demonstrou avanços expressivos em relação ao antecessor Sonnet 4.6, lançado em fevereiro, especialmente em áreas como raciocínio, uso de ferramentas, programação de software e trabalho com conhecimento.
Em um benchmark de programação agentic, o Sonnet 5 obteve pontuação de 63,2%, contra 69,2% do Opus 4.8 e 58,1% do Sonnet 4.6. Notavelmente, em um teste de trabalho com conhecimento, o novo modelo superou levemente o Opus 4.8, conhecido por resolver problemas extremamente complexos que exigem julgamento refinado e pesquisa profunda.
A Anthropic destaca que, entre o Sonnet 5 e o Opus 4.8, os usuários podem ajustar o nível de esforço para encontrar o equilíbrio ideal entre custo e desempenho. Testemunhos de desenvolvedores indicam que o modelo se destaca na conclusão de tarefas complexas onde versões anteriores paravam no meio do caminho, verificando seus próprios resultados sem necessidade de solicitação explícita.
Daniel Shepard, engenheiro sênior da Zapier, afirmou em comunicado que a ferramenta conseguiu executar uma tarefa em duas etapas — atualizar camadas de contas no Salesforce e enviar um anúncio de lançamento para contatos empresariais — de forma completa e autônoma. "Isso antigamente travava na metade. Para automação do dia a dia, é uma escolha óbvia", declarou.
No aspecto de segurança, o Sonnet 5 apresenta taxa reduzida de comportamentos indesejáveis, como cooperação com usos indevidos e enganação, sendo mais seguro para aplicações agentic. O modelo demonstra maior capacidade de recusar solicitações maliciosas e evitar tentativas de sequestro em ataques de injeção de prompt, além de apresentar menor incidência de alucinações e comportamento bajulador que seu antecessor.
Fabian Hedin, cofundador da Lovable, comentou que o Claude Sonnet 5 "recusa solicitações inseguras de forma limpa e consistente". Segundo ele, "na Lovable, estamos colocando ferramentas poderosas nas mãos de milhões de criadores. Um modelo que sabe quando dizer não é tão importante quanto um que sabe como construir".
Fonte: TechCrunch
