Kas jauns Claude Sonnet 4.6
Claude Sonnet 4.6 ir Anthropic spējīgākais Sonnet modelis ar būtiskiem uzlabojumiem kodēšanā, datora lietošanā, garā konteksta domāšanā un aģentu plānošanā. Tas tagad ir noklusējuma modelis claude.ai Free un Pro lietotājiem.
Izstrādātāji ar agrīno piekļuvi priekšroku dod Sonnet 4.6 pār tā priekšteci ar lielu pārsvaru un bieži pat pār Claude Opus 4.5, Anthropic gudrāko modeli no 2025. gada novembra.
Claude Sonnet 4.6 kodēšanas veiktspēja
Veiktspēja, kas iepriekš prasīja Opus klases modeli, tagad ir pieejama par Sonnet cenu ($3/$15 par miljonu tokenu). Galvenie uzlabojumi:
- Labāka koda ģenerēšana: Konsekventāks un precīzāks koda izvads dažādās valodās
- Uzlabota instrukciju ievērošana: Precīzāk ievēro sarežģītas daudzsoļu kodēšanas instrukcijas
- Stiprāka atkļūdošana: Labāk atklāj savas kļūdas un iesaka labojumus
- Reālo uzdevumu veiktspēja: Vislabākā līmenī ekonomiski vērtīgos biroja uzdevumos (GDPval-AA)
Komandām, kas izmanto MI drošības skenēšanu, Claude Code Security darbojas ar Sonnet 4.6 un Opus 4.6 ievainojamību noteikšanai kodu bāzēs.
Datora lietošanas etalontesti: OSWorld rezultāti
Anthropic bija universālās datora lietošanas pioneers 2024. gada oktobrī. OSWorld, standarta etalontestā, kur MI veic uzdevumus reālā programmatūrā kā Chrome, VS Code un LibreOffice, Sonnet modeļi ir parādījuši pastāvīgu uzlabošanos 16 mēnešu laikā:
| Modelis | OSWorld rezultāts |
|---|---|
| Sonnet 3.5 (2024. g. okt.) | Bāzlīnija |
| Sonnet 3.6 | +15% |
| Sonnet 4.5 | +40% |
| Sonnet 4.6 | +65% |
Agrīnie lietotāji ziņo par cilvēka līmeņa spējām uzdevumos kā sarežģītu izklājlapu navigēšana, daudzsoļu tīmekļa veidlapu aizpildīšana un darbs ar vairākām pārlūka cilnēm.
Prompt injection pretestība
Datora lietošana rada drošības riskus no prompt injection uzbrukumiem tīmekļa vietnēs. Sonnet 4.6 parāda būtisku uzlabojumu injekcijas pretestībā salīdzinājumā ar Sonnet 4.5, sasniedzot līdzīgu līmeni kā dārgākais Opus 4.6.
1M tokenu konteksta logs
Sonnet 4.6 piedāvā 1M tokenu konteksta logu beta versijā — pietiekami, lai apstrādātu veselas kodu bāzes, garus dokumentus vai plašas sarunas vēstures vienā pieprasījumā.
Ko Claude Sonnet 4.6 nozīmē izstrādātājiem
Izstrādātājiem Sonnet 4.6 ir būtisks izmaksu efektivitātes uzlabojums. Uzdevumi, kam iepriekš bija nepieciešami Opus klases modeļi (par $5/$25 par miljonu tokenu), tagad darbojas salīdzināmi par Sonnet cenu. Tas padara MI izstrādi pieejamāku:
- Agenturālās kodēšanas darba plūsmas: Garākas un uzticamākas automatizētas kodēšanas sesijas
- Koda pārskatīšana un atkļūdošana: Problēmu atklāšana pirms to nonākšanas ražošanā
- Datora lietošanas automatizācija: Mantotās programmatūras mijiedarbību automatizēšana
- Lielu kodu bāžu analīze: 1M konteksta loga izmantošana veselu projektu izpratnei
Sākotnējais avots
https://www.anthropic.com/news/claude-sonnet-4-6Bieži uzdotie jautājumi
Kas ir Claude Sonnet 4.6?
Cik maksā Claude Sonnet 4.6?
Vai Claude Sonnet 4.6 ir labāks par Opus 4.5 kodēšanā?
Kas ir Claude Sonnet 4.6 datora lietošana?
Esiet informēti
Saņemiet jaunākās AI ziņas savā e-pastā.
