Code Velocity
Modelli di IA

Claude Sonnet 4.6: coding di frontiera al prezzo Sonnet

·6 min di lettura·Anthropic·Fonte originale
Condividi
Progressione del benchmark OSWorld di Claude Sonnet 4.6 che mostra un miglioramento del 65% da Sonnet 3.5 a 4.6

Novità di Claude Sonnet 4.6

Claude Sonnet 4.6 è il modello Sonnet più capace di Anthropic, con importanti aggiornamenti nel coding, computer use, ragionamento a lungo contesto e pianificazione degli agenti. È ora il modello predefinito su claude.ai per gli utenti Free e Pro.

Gli sviluppatori con accesso anticipato preferiscono Sonnet 4.6 al predecessore con ampio margine, e spesso anche rispetto a Claude Opus 4.5, il modello più intelligente di Anthropic da novembre 2025.

Prestazioni di coding di Claude Sonnet 4.6

Le prestazioni che in precedenza richiedevano un modello di classe Opus sono ora disponibili al prezzo Sonnet ($3/$15 per milione di token). Miglioramenti chiave:

  • Migliore generazione di codice: Output di codice più consistente e accurato in tutti i linguaggi
  • Miglior esecuzione delle istruzioni: Segue istruzioni di coding complesse e multi-step con maggiore precisione
  • Debugging potenziato: Migliore nel trovare i propri errori e suggerire correzioni
  • Prestazioni su attività reali: Stato dell'arte nelle attività d'ufficio economicamente rilevanti (GDPval-AA)

Per i team che utilizzano la scansione di sicurezza alimentata dall'IA, Claude Code Security funziona sia con Sonnet 4.6 che con Opus 4.6 per rilevare vulnerabilità nei codebase.

Benchmark Computer Use: risultati OSWorld

Anthropic ha inaugurato il computer use generico nell'ottobre 2024. Su OSWorld, il benchmark standard in cui l'IA completa attività su software reale come Chrome, VS Code e LibreOffice, i modelli Sonnet hanno mostrato un miglioramento costante in 16 mesi:

ModelloPunteggio OSWorld
Sonnet 3.5 (ott 2024)Baseline
Sonnet 3.6+15%
Sonnet 4.5+40%
Sonnet 4.6+65%

I primi utilizzatori riportano capacità a livello umano in attività come navigare fogli di calcolo complessi, compilare form web multi-step e lavorare con più schede del browser.

Resistenza alla prompt injection

Il computer use comporta rischi di sicurezza da attacchi di prompt injection sui siti web. Sonnet 4.6 mostra un importante miglioramento nella resistenza alle injection rispetto a Sonnet 4.5, con prestazioni simili al più costoso Opus 4.6.

Finestra di contesto da 1M token

Sonnet 4.6 dispone di una finestra di contesto da 1M token in beta, sufficiente per elaborare intere codebase, documenti lunghi o cronologie di conversazioni estese in una singola richiesta.

Cosa significa Claude Sonnet 4.6 per gli sviluppatori

Per gli sviluppatori, Sonnet 4.6 rappresenta un significativo miglioramento nel rapporto costo-efficienza. Attività che in precedenza richiedevano modelli di classe Opus (a $5/$25 per milione di token) ora offrono prestazioni comparabili al prezzo Sonnet. Questo rende lo sviluppo assistito dall'IA più accessibile per:

  • Flussi di lavoro di coding agentico: Sessioni di coding automatizzate più lunghe e affidabili
  • Code review e debugging: Individuare problemi prima che arrivino in produzione
  • Automazione computer use: Automatizzare le interazioni con software legacy
  • Analisi di codebase grandi: Usare la finestra di contesto da 1M per comprendere interi progetti

Domande Frequenti

Cos'è Claude Sonnet 4.6?
Claude Sonnet 4.6 è il modello Sonnet più capace di Anthropic, rilasciato a febbraio 2026. Offre prestazioni di coding e ragionamento che in precedenza richiedevano modelli di classe Opus, ma al prezzo Sonnet ($3/$15 per milione di token). È ora il modello predefinito su claude.ai per gli utenti Free e Pro e include una finestra di contesto da 1M token in beta.
Quanto costa Claude Sonnet 4.6?
Claude Sonnet 4.6 costa $3 per milione di token in input e $15 per milione di token in output, come Sonnet 4.5. Questo è il 40% più economico del prezzo Opus ($5/$25). È disponibile su claude.ai, tramite API Anthropic con model ID claude-sonnet-4-6, Amazon Bedrock e Google Cloud Vertex AI.
Claude Sonnet 4.6 è migliore di Opus 4.5 per il coding?
Sì. Gli sviluppatori con accesso anticipato hanno spesso preferito Sonnet 4.6 a Claude Opus 4.5 per le attività di coding, nonostante Sonnet sia un livello più economico. Sonnet 4.6 mostra particolare forza nella generazione di codice, nel seguire istruzioni e nel debugging. Per le attività più impegnative, Claude Opus 4.6 guida ancora nei benchmark come Terminal-Bench 2.0.
Cos'è il computer use di Claude Sonnet 4.6?
Il computer use permette a Claude di interagire con il software come un umano, cliccando pulsanti, compilando form e navigando interfacce. Su OSWorld, il benchmark standard per il computer use, Sonnet 4.6 ottiene un punteggio del 65% superiore rispetto al baseline di Sonnet 3.5 di ottobre 2024. Ha anche una resistenza alla prompt injection significativamente migliorata, paragonabile al più costoso Opus 4.6.

Resta aggiornato

Ricevi le ultime notizie sull'IA nella tua casella.

Condividi