Code Velocity
MI modeļi

Claude Sonnet 4.6: priekšējās līnijas kodēšana par Sonnet cenu

·6 min lasīšana·Anthropic·Sākotnējais avots
Dalīties
Claude Sonnet 4.6 OSWorld etalontesta progresija, kas parāda 65% uzlabojumu no Sonnet 3.5 līdz 4.6

Kas jauns Claude Sonnet 4.6

Claude Sonnet 4.6 ir Anthropic spējīgākais Sonnet modelis ar būtiskiem uzlabojumiem kodēšanā, datora lietošanā, garā konteksta domāšanā un aģentu plānošanā. Tas tagad ir noklusējuma modelis claude.ai Free un Pro lietotājiem.

Izstrādātāji ar agrīno piekļuvi priekšroku dod Sonnet 4.6 pār tā priekšteci ar lielu pārsvaru un bieži pat pār Claude Opus 4.5, Anthropic gudrāko modeli no 2025. gada novembra.

Claude Sonnet 4.6 kodēšanas veiktspēja

Veiktspēja, kas iepriekš prasīja Opus klases modeli, tagad ir pieejama par Sonnet cenu ($3/$15 par miljonu tokenu). Galvenie uzlabojumi:

  • Labāka koda ģenerēšana: Konsekventāks un precīzāks koda izvads dažādās valodās
  • Uzlabota instrukciju ievērošana: Precīzāk ievēro sarežģītas daudzsoļu kodēšanas instrukcijas
  • Stiprāka atkļūdošana: Labāk atklāj savas kļūdas un iesaka labojumus
  • Reālo uzdevumu veiktspēja: Vislabākā līmenī ekonomiski vērtīgos biroja uzdevumos (GDPval-AA)

Komandām, kas izmanto MI drošības skenēšanu, Claude Code Security darbojas ar Sonnet 4.6 un Opus 4.6 ievainojamību noteikšanai kodu bāzēs.

Datora lietošanas etalontesti: OSWorld rezultāti

Anthropic bija universālās datora lietošanas pioneers 2024. gada oktobrī. OSWorld, standarta etalontestā, kur MI veic uzdevumus reālā programmatūrā kā Chrome, VS Code un LibreOffice, Sonnet modeļi ir parādījuši pastāvīgu uzlabošanos 16 mēnešu laikā:

ModelisOSWorld rezultāts
Sonnet 3.5 (2024. g. okt.)Bāzlīnija
Sonnet 3.6+15%
Sonnet 4.5+40%
Sonnet 4.6+65%

Agrīnie lietotāji ziņo par cilvēka līmeņa spējām uzdevumos kā sarežģītu izklājlapu navigēšana, daudzsoļu tīmekļa veidlapu aizpildīšana un darbs ar vairākām pārlūka cilnēm.

Prompt injection pretestība

Datora lietošana rada drošības riskus no prompt injection uzbrukumiem tīmekļa vietnēs. Sonnet 4.6 parāda būtisku uzlabojumu injekcijas pretestībā salīdzinājumā ar Sonnet 4.5, sasniedzot līdzīgu līmeni kā dārgākais Opus 4.6.

1M tokenu konteksta logs

Sonnet 4.6 piedāvā 1M tokenu konteksta logu beta versijā — pietiekami, lai apstrādātu veselas kodu bāzes, garus dokumentus vai plašas sarunas vēstures vienā pieprasījumā.

Ko Claude Sonnet 4.6 nozīmē izstrādātājiem

Izstrādātājiem Sonnet 4.6 ir būtisks izmaksu efektivitātes uzlabojums. Uzdevumi, kam iepriekš bija nepieciešami Opus klases modeļi (par $5/$25 par miljonu tokenu), tagad darbojas salīdzināmi par Sonnet cenu. Tas padara MI izstrādi pieejamāku:

  • Agenturālās kodēšanas darba plūsmas: Garākas un uzticamākas automatizētas kodēšanas sesijas
  • Koda pārskatīšana un atkļūdošana: Problēmu atklāšana pirms to nonākšanas ražošanā
  • Datora lietošanas automatizācija: Mantotās programmatūras mijiedarbību automatizēšana
  • Lielu kodu bāžu analīze: 1M konteksta loga izmantošana veselu projektu izpratnei

Bieži uzdotie jautājumi

Kas ir Claude Sonnet 4.6?
Claude Sonnet 4.6 ir Anthropic spējīgākais Sonnet līmeņa modelis, izlaists 2026. gada februārī. Tas nodrošina kodēšanas un domāšanas veiktspēju, kas iepriekš prasīja Opus klases modeļus, bet par Sonnet cenu ($3/$15 par miljonu tokenu). Tas tagad ir noklusējuma modelis claude.ai Free un Pro lietotājiem un ietver 1M tokenu konteksta logu beta versijā.
Cik maksā Claude Sonnet 4.6?
Claude Sonnet 4.6 maksā $3 par miljonu ievades tokenu un $15 par miljonu izvades tokenu, tāda pati cena kā Sonnet 4.5. Tas ir 40% lētāks nekā Opus cena ($5/$25). Pieejams claude.ai, Anthropic API ar modeļa ID claude-sonnet-4-6, Amazon Bedrock un Google Cloud Vertex AI.
Vai Claude Sonnet 4.6 ir labāks par Opus 4.5 kodēšanā?
Jā. Izstrādātāji ar agrīno piekļuvi bieži priekšroku deva Sonnet 4.6 pār Claude Opus 4.5 kodēšanas uzdevumiem, lai gan Sonnet ir lētāks līmenis. Sonnet 4.6 parāda īpašu spēku koda ģenerēšanā, instrukciju ievērošanā un atkļūdošanā. Visprašīgākajiem uzdevumiem Claude Opus 4.6 joprojām ir vadībā etalontestos kā Terminal-Bench 2.0.
Kas ir Claude Sonnet 4.6 datora lietošana?
Datora lietošana ļauj Claude mijiedarboties ar programmatūru kā cilvēkam — klikšķināt pogas, aizpildīt veidlapas un navigēt saskarnes. OSWorld, standarta datora lietošanas etalontestā, Sonnet 4.6 sasniedz 65% augstāku rezultātu nekā sākotnējā Sonnet 3.5 bāzlīnija no 2024. gada oktobra. Tam ir arī ievērojami uzlabota prompt injection pretestība, kas ir līdzīga dārgākajam Opus 4.6.

Esiet informēti

Saņemiet jaunākās AI ziņas savā e-pastā.

Dalīties