Kas naujo Claude Sonnet 4.6
Claude Sonnet 4.6 yra pajėgiausias Anthropic Sonnet modelis su dideliais patobulinimais kodavime, computer use, ilgo konteksto samprotavime ir agentų planavime. Dabar tai numatytasis modelis claude.ai Free ir Pro naudotojams.
Ankstyvosios prieigos kūrėjai renkasi Sonnet 4.6 dideliu skirtumu prieš pirmtaką — ir dažnai net prieš Claude Opus 4.5, protingiausią Anthropic modelį nuo 2025 m. lapkričio.
Claude Sonnet 4.6 kodavimo našumas
Našumas, kuris anksčiau reikalavo Opus klasės modelio, dabar prieinamas Sonnet kaina ($3/$15 už milijoną tokenų). Pagrindiniai patobulinimai:
- Geresnis kodo generavimas: Nuoseklesnis, tikslesnis kodo rezultatas įvairiomis kalbomis
- Pagerintas instrukcijų laikymasis: Tiksliau laikosi sudėtingų daugiažingsnių kodavimo instrukcijų
- Stipresnis derinimas: Geriau pastebi savo klaidas ir siūlo pataisymus
- Realių užduočių našumas: Pažangiausias ekonomiškai vertingose biuro užduotyse (GDPval-AA)
Komandoms, naudojančioms DI valdomą saugumo skenavimą, Claude Code Security veikia su Sonnet 4.6 ir Opus 4.6 pažeidžiamumų aptikimui kodo bazėse.
Computer Use etalonai: OSWorld rezultatai
Anthropic buvo bendros paskirties computer use pradininkas 2024 m. spalį. OSWorld, standartiniame etalone, kuriame DI atlieka užduotis realioje programinėje įrangoje kaip Chrome, VS Code ir LibreOffice, Sonnet modeliai per 16 mėnesių parodė nuolatinį tobulėjimą:
| Modelis | OSWorld balas |
|---|---|
| Sonnet 3.5 (2024 m. spalis) | Bazė |
| Sonnet 3.6 | +15 % |
| Sonnet 4.5 | +40 % |
| Sonnet 4.6 | +65 % |
Ankstyvieji naudotojai praneša apie žmogaus lygio gebėjimus tokiose užduotyse kaip sudėtingų skaičiuoklių naršymas, daugiažingsnių interneto formų pildymas ir darbas keliose naršyklės kortelėse.
Atsparumas Prompt Injekcijai
Computer use kelia saugumo rizikas dėl prompt injekcijos atakų svetainėse. Sonnet 4.6 rodo didelį atsparumo injekcijai pagerėjimą palyginti su Sonnet 4.5, veikdamas panašiai kaip brangesnis Opus 4.6.
1M tokenų konteksto langas
Sonnet 4.6 turi 1M tokenų konteksto langą beta versijoje — pakankamai apdoroti visas kodo bazes, ilgus dokumentus ar plačias pokalbių istorijas viena užklausa.
Ką Claude Sonnet 4.6 reiškia kūrėjams
Kūrėjams Sonnet 4.6 reiškia reikšmingą kainos ir efektyvumo pagerėjimą. Užduotys, kurioms anksčiau reikėjo Opus klasės modelių ($5/$25 už milijoną tokenų), dabar veikia palyginamai Sonnet kaina. Tai DI valdomą kūrimą daro prieinamesnį:
- Agentinio kodavimo darbo eigos: Ilgesnės, patikimesnės automatinės kodavimo sesijos
- Kodo peržiūra ir derinimas: Problemų aptikimas prieš jas pasiekiant produkciją
- Computer use automatizavimas: Senos programinės įrangos sąveikos automatizavimas
- Didelių kodo bazių analizė: 1M konteksto lango naudojimas visų projektų supratimui
Originalus šaltinis
https://www.anthropic.com/news/claude-sonnet-4-6Dažniausiai užduodami klausimai
Kas yra Claude Sonnet 4.6?
Kiek kainuoja Claude Sonnet 4.6?
Ar Claude Sonnet 4.6 geresnis už Opus 4.5 kodavimui?
Kas yra Claude Sonnet 4.6 computer use?
Būkite informuoti
Gaukite naujausias AI naujienas el. paštu.
