Novetats de Claude Sonnet 4.6
Claude Sonnet 4.6 és el model Sonnet més capaç d'Anthropic, amb millores importants en codi, ús d'ordinador, raonament amb context llarg i planificació d'agents. Ara és el model per defecte a claude.ai per als usuaris Free i Pro.
Els desenvolupadors amb accés anticipat prefereixen Sonnet 4.6 per sobre del seu predecessor per un ampli marge, i sovint fins i tot per sobre de Claude Opus 4.5, el model més intel·ligent d'Anthropic de novembre de 2025.
Rendiment en codi de Claude Sonnet 4.6
El rendiment que anteriorment requeria un model de classe Opus ara està disponible a preu de Sonnet ($3/$15 per milió de tokens). Millores clau:
- Millor generació de codi: Producció de codi més consistent i precisa en tots els llenguatges
- Millor seguiment d'instruccions: Segueix instruccions de codi complexes de múltiples passos amb més precisió
- Depuració més forta: Millor en detectar els seus propis errors i suggerir correccions
- Rendiment en tasques reals: Estat de l'art en tasques d'oficina econòmicament valuoses (GDPval-AA)
Per als equips que utilitzen escaneig de seguretat potenciat per IA, Claude Code Security funciona tant amb Sonnet 4.6 com amb Opus 4.6 per detectar vulnerabilitats en codis.
Benchmarks d'ús d'ordinador: resultats d'OSWorld
Anthropic va ser pionera en l'ús d'ordinador de propòsit general a l'octubre de 2024. A OSWorld, el benchmark estàndard on la IA completa tasques en programari real com Chrome, VS Code i LibreOffice, els models Sonnet han mostrat una millora constant durant 16 mesos:
| Model | Puntuació OSWorld |
|---|---|
| Sonnet 3.5 (oct 2024) | Línia base |
| Sonnet 3.6 | +15% |
| Sonnet 4.5 | +40% |
| Sonnet 4.6 | +65% |
Els primers usuaris informen d'una capacitat de nivell humà en tasques com navegar per fulls de càlcul complexos, omplir formularis web de múltiples passos i treballar amb múltiples pestanyes del navegador.
Resistència a la injecció de prompts
L'ús d'ordinador comporta riscos de seguretat per atacs d'injecció de prompts en llocs web. Sonnet 4.6 mostra una millora important en la resistència a la injecció comparada amb Sonnet 4.5, amb un rendiment similar al del més car Opus 4.6.
Finestra de context d'1M de tokens
Sonnet 4.6 inclou una finestra de context d'1M de tokens en beta, suficient per processar codis sencers, documents llargs o historials de conversa extensos en una sola petició.
Què significa Claude Sonnet 4.6 per als desenvolupadors
Per als desenvolupadors, Sonnet 4.6 representa una millora significativa en relació cost-eficiència. Tasques que anteriorment necessitaven models de classe Opus (a $5/$25 per milió de tokens) ara rendeixen de forma comparable a preu de Sonnet. Això fa el desenvolupament potenciat per IA més accessible per a:
- Fluxos de treball de codi agèntic: Sessions automatitzades de codi més llargues i fiables
- Revisió de codi i depuració: Detectar problemes abans que arribin a producció
- Automatització d'ús d'ordinador: Automatitzar interaccions amb programari heretat
- Anàlisi de codis grans: Utilitzar la finestra de context d'1M per entendre projectes sencers
Font original
https://www.anthropic.com/news/claude-sonnet-4-6Preguntes freqüents
Què és Claude Sonnet 4.6?
Quant costa Claude Sonnet 4.6?
Claude Sonnet 4.6 és millor que Opus 4.5 per a codi?
Què és l'ús d'ordinador de Claude Sonnet 4.6?
Manteniu-vos al dia
Rebeu les últimes notícies d'IA al correu.
