Code Velocity
Modelos de IA

Claude Sonnet 4.6: Código de Fronteira pelo Preço Sonnet

·6 min de leitura·Anthropic·Fonte original
Compartilhar
Progressão do benchmark OSWorld do Claude Sonnet 4.6 mostrando melhoria de 65% do Sonnet 3.5 ao 4.6

O Que Há de Novo no Claude Sonnet 4.6

Claude Sonnet 4.6 é o modelo Sonnet mais capaz da Anthropic. Entrega um upgrade completo em código, uso de computador, raciocínio de contexto longo, planejamento de agentes, trabalho com conhecimento e design. É agora o modelo padrão no claude.ai para usuários Free e Pro.

O resultado de destaque: desenvolvedores com acesso antecipado preferem o Sonnet 4.6 ao seu predecessor por larga margem, e frequentemente até ao Claude Opus 4.5, o modelo mais inteligente da Anthropic de novembro de 2025.

Performance em Código do Claude Sonnet 4.6

Performance que antes exigia um modelo Opus agora está disponível pelo preço Sonnet ($3/$15 por milhão de tokens). Melhorias principais:

  • Melhor geração de código: Output mais consistente e preciso em diversas linguagens
  • Melhor seguimento de instruções: Segue instruções complexas multi-etapas com mais precisão
  • Debugging mais forte: Melhor em detectar seus próprios erros e sugerir correções
  • Tarefas do mundo real: Estado da arte em tarefas de escritório economicamente valiosas (GDPval-AA)

Para equipes que usam escaneamento de segurança com IA, o Claude Code Security funciona com Sonnet 4.6 e Opus 4.6 para detectar vulnerabilidades em codebases.

Benchmarks de Uso de Computador: Resultados OSWorld

A Anthropic foi pioneira no uso de computador de propósito geral em outubro de 2024. No OSWorld, o benchmark padrão onde a IA completa tarefas em software real como Chrome, VS Code e LibreOffice, os modelos Sonnet mostram melhoria constante ao longo de 16 meses:

ModeloScore OSWorld
Sonnet 3.5 (Out 2024)Baseline
Sonnet 3.6+15%
Sonnet 4.5+40%
Sonnet 4.6+65%

Usuários iniciais reportam capacidade de nível humano em tarefas como navegar planilhas complexas, preencher formulários web multi-etapas e trabalhar em múltiplas abas do navegador.

Resistência a Prompt Injection

Uso de computador apresenta riscos de segurança de ataques de prompt injection em websites. Sonnet 4.6 mostra grande melhoria na resistência a injeções comparado ao Sonnet 4.5, performando similarmente ao mais caro Opus 4.6.

Janela de Contexto de 1M Tokens

Sonnet 4.6 possui janela de contexto de 1M tokens em beta, suficiente para processar codebases inteiros, documentos longos ou históricos extensos de conversa em uma única requisição.

O Que o Claude Sonnet 4.6 Significa para Desenvolvedores

Para desenvolvedores, o Sonnet 4.6 representa uma melhoria significativa de custo-eficiência. Tarefas que antes precisavam de modelos Opus (a $5/$25 por milhão de tokens) agora performam comparávelmente pelo preço Sonnet. Isso torna o desenvolvimento com IA mais acessível para:

  • Workflows de código agêntico: Sessões automatizadas de código mais longas e confiáveis
  • Revisão de código e debugging: Detectar problemas antes que cheguem à produção
  • Automação de uso de computador: Automatizar interações com software legado
  • Análise de grandes codebases: Usar a janela de 1M para entender projetos inteiros

Perguntas Frequentes

O que é o Claude Sonnet 4.6?
Claude Sonnet 4.6 é o modelo Sonnet mais capaz da Anthropic, lançado em fevereiro de 2026. Entrega performance de código e raciocínio que antes exigia modelos Opus, mas pelo preço Sonnet ($3/$15 por milhão de tokens). É agora o modelo padrão no claude.ai para usuários Free e Pro e inclui janela de contexto de 1M tokens em beta.
Quanto custa o Claude Sonnet 4.6?
Claude Sonnet 4.6 custa $3 por milhão de tokens de entrada e $15 por milhão de tokens de saída, mesmo preço do Sonnet 4.5. Isso é 40% mais barato que o Opus ($5/$25). Está disponível no claude.ai, na API da Anthropic com model ID claude-sonnet-4-6, Amazon Bedrock e Google Cloud Vertex AI.
O Claude Sonnet 4.6 é melhor que o Opus 4.5 para código?
Sim. Desenvolvedores com acesso antecipado frequentemente preferiram o Sonnet 4.6 ao Claude Opus 4.5 para tarefas de código, apesar do Sonnet ser uma tier mais barata. O Sonnet 4.6 mostra força particular em geração de código, seguimento de instruções e debugging. Para tarefas mais exigentes, o Claude Opus 4.6 ainda lidera em benchmarks como Terminal-Bench 2.0.
O que é uso de computador no Claude Sonnet 4.6?
Uso de computador permite que o Claude interaja com software como um humano, clicando botões, preenchendo formulários e navegando interfaces. No OSWorld, o benchmark padrão para uso de computador, o Sonnet 4.6 pontua 65% mais alto que a baseline original do Sonnet 3.5 de outubro de 2024. Também tem resistência a prompt injection significativamente melhor, performando similarmente ao mais caro Opus 4.6.

Fique Atualizado

Receba as últimas novidades de IA no seu e-mail.

Compartilhar