Code Velocity
Models d'IA

Claude Sonnet 4.6: rendiment de frontera a preu Sonnet

·6 min de lectura·Anthropic·Font original
Compartir
Progressió del benchmark OSWorld de Claude Sonnet 4.6 mostrant una millora del 65% de Sonnet 3.5 a 4.6

Novetats de Claude Sonnet 4.6

Claude Sonnet 4.6 és el model Sonnet més capaç d'Anthropic, amb millores importants en codi, ús d'ordinador, raonament amb context llarg i planificació d'agents. Ara és el model per defecte a claude.ai per als usuaris Free i Pro.

Els desenvolupadors amb accés anticipat prefereixen Sonnet 4.6 per sobre del seu predecessor per un ampli marge, i sovint fins i tot per sobre de Claude Opus 4.5, el model més intel·ligent d'Anthropic de novembre de 2025.

Rendiment en codi de Claude Sonnet 4.6

El rendiment que anteriorment requeria un model de classe Opus ara està disponible a preu de Sonnet ($3/$15 per milió de tokens). Millores clau:

  • Millor generació de codi: Producció de codi més consistent i precisa en tots els llenguatges
  • Millor seguiment d'instruccions: Segueix instruccions de codi complexes de múltiples passos amb més precisió
  • Depuració més forta: Millor en detectar els seus propis errors i suggerir correccions
  • Rendiment en tasques reals: Estat de l'art en tasques d'oficina econòmicament valuoses (GDPval-AA)

Per als equips que utilitzen escaneig de seguretat potenciat per IA, Claude Code Security funciona tant amb Sonnet 4.6 com amb Opus 4.6 per detectar vulnerabilitats en codis.

Benchmarks d'ús d'ordinador: resultats d'OSWorld

Anthropic va ser pionera en l'ús d'ordinador de propòsit general a l'octubre de 2024. A OSWorld, el benchmark estàndard on la IA completa tasques en programari real com Chrome, VS Code i LibreOffice, els models Sonnet han mostrat una millora constant durant 16 mesos:

ModelPuntuació OSWorld
Sonnet 3.5 (oct 2024)Línia base
Sonnet 3.6+15%
Sonnet 4.5+40%
Sonnet 4.6+65%

Els primers usuaris informen d'una capacitat de nivell humà en tasques com navegar per fulls de càlcul complexos, omplir formularis web de múltiples passos i treballar amb múltiples pestanyes del navegador.

Resistència a la injecció de prompts

L'ús d'ordinador comporta riscos de seguretat per atacs d'injecció de prompts en llocs web. Sonnet 4.6 mostra una millora important en la resistència a la injecció comparada amb Sonnet 4.5, amb un rendiment similar al del més car Opus 4.6.

Finestra de context d'1M de tokens

Sonnet 4.6 inclou una finestra de context d'1M de tokens en beta, suficient per processar codis sencers, documents llargs o historials de conversa extensos en una sola petició.

Què significa Claude Sonnet 4.6 per als desenvolupadors

Per als desenvolupadors, Sonnet 4.6 representa una millora significativa en relació cost-eficiència. Tasques que anteriorment necessitaven models de classe Opus (a $5/$25 per milió de tokens) ara rendeixen de forma comparable a preu de Sonnet. Això fa el desenvolupament potenciat per IA més accessible per a:

  • Fluxos de treball de codi agèntic: Sessions automatitzades de codi més llargues i fiables
  • Revisió de codi i depuració: Detectar problemes abans que arribin a producció
  • Automatització d'ús d'ordinador: Automatitzar interaccions amb programari heretat
  • Anàlisi de codis grans: Utilitzar la finestra de context d'1M per entendre projectes sencers

Preguntes freqüents

Què és Claude Sonnet 4.6?
Claude Sonnet 4.6 és el model de nivell Sonnet més capaç d'Anthropic, llançat al febrer de 2026. Ofereix rendiment en codi i raonament que anteriorment requeria models de classe Opus, però a preu de Sonnet ($3/$15 per milió de tokens). Ara és el model per defecte a claude.ai per als usuaris Free i Pro i inclou una finestra de context d'1M de tokens en beta.
Quant costa Claude Sonnet 4.6?
Claude Sonnet 4.6 costa $3 per milió de tokens d'entrada i $15 per milió de tokens de sortida, el mateix que Sonnet 4.5. Això és un 40% més barat que el preu d'Opus ($5/$25). Està disponible a claude.ai, a l'API d'Anthropic amb model ID claude-sonnet-4-6, Amazon Bedrock i Google Cloud Vertex AI.
Claude Sonnet 4.6 és millor que Opus 4.5 per a codi?
Sí. Els desenvolupadors amb accés anticipat van preferir sovint Sonnet 4.6 per sobre de Claude Opus 4.5 per a tasques de codi, malgrat ser un nivell més econòmic. Sonnet 4.6 mostra una fortalesa particular en generació de codi, seguiment d'instruccions i depuració. Per a les tasques més exigents, Claude Opus 4.6 encara lidera en benchmarks com Terminal-Bench 2.0.
Què és l'ús d'ordinador de Claude Sonnet 4.6?
L'ús d'ordinador permet a Claude interactuar amb programari com un humà, fent clic a botons, omplint formularis i navegant per interfícies. A OSWorld, el benchmark estàndard per a l'ús d'ordinador, Sonnet 4.6 puntua un 65% més alt que la línia base original de Sonnet 3.5 d'octubre de 2024. També té una resistència a la injecció de prompts significativament millorada, amb un rendiment similar al del més car Opus 4.6.

Manteniu-vos al dia

Rebeu les últimes notícies d'IA al correu.

Compartir