Újdonságok a Claude Sonnet 4.6-ban
A Claude Sonnet 4.6 az Anthropic legképesebb Sonnet modellje, jelentős fejlesztésekkel kódolásban, számítógép-használatban, hosszú kontextusú gondolkodásban és ágenstervezésben. Most ez az alapértelmezett modell a claude.ai-on az ingyenes és Pro felhasználók számára.
A korai hozzáféréssel rendelkező fejlesztők nagy különbséggel részesítik előnyben a Sonnet 4.6-ot elődjéhez képest, és gyakran még a Claude Opus 4.5-tel szemben is, az Anthropic 2025 novemberi legokosabb modelljéhez képest.
Claude Sonnet 4.6 kódolási teljesítmény
Az a teljesítmény, amihez korábban Opus-osztályú modell kellett, most Sonnet áron érhető el ($3/$15 millió tokenenként). Fő fejlesztések:
- Jobb kódgenerálás: Következetesebb, pontosabb kódkimenet nyelvek között
- Javított utasításkövetés: Összetett többlépéses kódolási utasításokat pontosabban követ
- Erősebb hibakeresés: Jobban felismeri saját hibáit és javaslatokat tesz javításokra
- Valós feladat teljesítmény: A legmodernebb gazdaságilag értékes irodai feladatokban (GDPval-AA)
Az MI-alapú biztonsági vizsgálatot használó csapatok számára a Claude Code Security a Sonnet 4.6 és az Opus 4.6 modellel egyaránt működik a kódbázisok sebezhetőségeinek felderítéséhez.
Számítógép-használat benchmarkok: OSWorld eredmények
Az Anthropic 2024 októberében úttörőként vezette be az általános célú számítógép-használatot. Az OSWorld-ön, a standard benchmarkon, ahol az MI valós szoftverekben (Chrome, VS Code, LibreOffice) hajt végre feladatokat, a Sonnet modellek 16 hónap alatt folyamatos javulást mutattak:
| Modell | OSWorld pontszám |
|---|---|
| Sonnet 3.5 (2024. okt.) | Alapvonal |
| Sonnet 3.6 | +15% |
| Sonnet 4.5 | +40% |
| Sonnet 4.6 | +65% |
A korai felhasználók emberi szintű képességekről számolnak be olyan feladatokban, mint összetett táblázatkezelőkben való navigáció, többlépéses webes űrlapok kitöltése és több böngészőlapon való munka.
Prompt injection ellenállás
A számítógép-használat biztonsági kockázatokat jelent a weboldalakon történő prompt injection támadások miatt. A Sonnet 4.6 jelentős javulást mutat az injection ellenállásban a Sonnet 4.5-höz képest, hasonlóan teljesítve a drágább Opus 4.6-hoz.
1M tokenes kontextusablak
A Sonnet 4.6 béta verzióban 1M tokenes kontextusablakkal rendelkezik, ami elég teljes kódbázisok, hosszú dokumentumok vagy kiterjedt beszélgetési előzmények feldolgozásához egyetlen kérésben.
Mit jelent a Claude Sonnet 4.6 a fejlesztők számára
A fejlesztők számára a Sonnet 4.6 jelentős költséghatékonysági javulást jelent. Az Opus-osztályú modelleket ($5/$25 millió tokenenként) igénylő feladatok most összehasonlítható teljesítményt nyújtanak Sonnet áron. Ez elérhetőbbé teszi az MI-alapú fejlesztést a következő területeken:
- Agens kódolási munkafolyamatok: Hosszabb, megbízhatóbb automatizált kódolási munkamenetek
- Kódellenőrzés és hibakeresés: Problémák felismerése mielőtt éles környezetbe kerülnének
- Számítógép-használat automatizálás: Régi szoftverek interakcióinak automatizálása
- Nagy kódbázis elemzés: Az 1M kontextusablak használata teljes projektek megértéséhez
Eredeti forrás
https://www.anthropic.com/news/claude-sonnet-4-6Gyakran ismételt kérdések
Mi az a Claude Sonnet 4.6?
Mennyibe kerül a Claude Sonnet 4.6?
Jobb a Claude Sonnet 4.6 kódolásban, mint az Opus 4.5?
Mi az a Claude Sonnet 4.6 számítógép-használat?
Maradjon naprakész
Kapja meg a legfrissebb AI híreket e-mailben.
