Code Velocity
MI modellek

Claude Sonnet 4.6: Élvonalbeli kódolás Sonnet áron

·6 perc olvasás·Anthropic·Eredeti forrás
Megosztás
Claude Sonnet 4.6 OSWorld benchmark fejlődés 65%-os javulással a Sonnet 3.5-től a 4.6-ig

Újdonságok a Claude Sonnet 4.6-ban

A Claude Sonnet 4.6 az Anthropic legképesebb Sonnet modellje, jelentős fejlesztésekkel kódolásban, számítógép-használatban, hosszú kontextusú gondolkodásban és ágenstervezésben. Most ez az alapértelmezett modell a claude.ai-on az ingyenes és Pro felhasználók számára.

A korai hozzáféréssel rendelkező fejlesztők nagy különbséggel részesítik előnyben a Sonnet 4.6-ot elődjéhez képest, és gyakran még a Claude Opus 4.5-tel szemben is, az Anthropic 2025 novemberi legokosabb modelljéhez képest.

Claude Sonnet 4.6 kódolási teljesítmény

Az a teljesítmény, amihez korábban Opus-osztályú modell kellett, most Sonnet áron érhető el ($3/$15 millió tokenenként). Fő fejlesztések:

  • Jobb kódgenerálás: Következetesebb, pontosabb kódkimenet nyelvek között
  • Javított utasításkövetés: Összetett többlépéses kódolási utasításokat pontosabban követ
  • Erősebb hibakeresés: Jobban felismeri saját hibáit és javaslatokat tesz javításokra
  • Valós feladat teljesítmény: A legmodernebb gazdaságilag értékes irodai feladatokban (GDPval-AA)

Az MI-alapú biztonsági vizsgálatot használó csapatok számára a Claude Code Security a Sonnet 4.6 és az Opus 4.6 modellel egyaránt működik a kódbázisok sebezhetőségeinek felderítéséhez.

Számítógép-használat benchmarkok: OSWorld eredmények

Az Anthropic 2024 októberében úttörőként vezette be az általános célú számítógép-használatot. Az OSWorld-ön, a standard benchmarkon, ahol az MI valós szoftverekben (Chrome, VS Code, LibreOffice) hajt végre feladatokat, a Sonnet modellek 16 hónap alatt folyamatos javulást mutattak:

ModellOSWorld pontszám
Sonnet 3.5 (2024. okt.)Alapvonal
Sonnet 3.6+15%
Sonnet 4.5+40%
Sonnet 4.6+65%

A korai felhasználók emberi szintű képességekről számolnak be olyan feladatokban, mint összetett táblázatkezelőkben való navigáció, többlépéses webes űrlapok kitöltése és több böngészőlapon való munka.

Prompt injection ellenállás

A számítógép-használat biztonsági kockázatokat jelent a weboldalakon történő prompt injection támadások miatt. A Sonnet 4.6 jelentős javulást mutat az injection ellenállásban a Sonnet 4.5-höz képest, hasonlóan teljesítve a drágább Opus 4.6-hoz.

1M tokenes kontextusablak

A Sonnet 4.6 béta verzióban 1M tokenes kontextusablakkal rendelkezik, ami elég teljes kódbázisok, hosszú dokumentumok vagy kiterjedt beszélgetési előzmények feldolgozásához egyetlen kérésben.

Mit jelent a Claude Sonnet 4.6 a fejlesztők számára

A fejlesztők számára a Sonnet 4.6 jelentős költséghatékonysági javulást jelent. Az Opus-osztályú modelleket ($5/$25 millió tokenenként) igénylő feladatok most összehasonlítható teljesítményt nyújtanak Sonnet áron. Ez elérhetőbbé teszi az MI-alapú fejlesztést a következő területeken:

  • Agens kódolási munkafolyamatok: Hosszabb, megbízhatóbb automatizált kódolási munkamenetek
  • Kódellenőrzés és hibakeresés: Problémák felismerése mielőtt éles környezetbe kerülnének
  • Számítógép-használat automatizálás: Régi szoftverek interakcióinak automatizálása
  • Nagy kódbázis elemzés: Az 1M kontextusablak használata teljes projektek megértéséhez

Gyakran ismételt kérdések

Mi az a Claude Sonnet 4.6?
A Claude Sonnet 4.6 az Anthropic legképesebb Sonnet-szintű modellje, amely 2026 februárjában jelent meg. Olyan kódolási és gondolkodási teljesítményt nyújt, amihez korábban Opus-osztályú modellek kellettek, de Sonnet áron ($3/$15 millió tokenenként). Most ez az alapértelmezett modell a claude.ai-on az ingyenes és Pro felhasználók számára, és 1M tokenes kontextusablakkal rendelkezik béta verzióban.
Mennyibe kerül a Claude Sonnet 4.6?
A Claude Sonnet 4.6 ára $3 millió bemeneti tokenenként és $15 millió kimeneti tokenenként, ugyanannyi, mint a Sonnet 4.5. Ez 40%-kal olcsóbb az Opus árazásnál ($5/$25). Elérhető a claude.ai-on, az Anthropic API-n claude-sonnet-4-6 modell azonosítóval, Amazon Bedrock-on és Google Cloud Vertex AI-on.
Jobb a Claude Sonnet 4.6 kódolásban, mint az Opus 4.5?
Igen. A korai hozzáféréssel rendelkező fejlesztők gyakran előnyben részesítették a Sonnet 4.6-ot a Claude Opus 4.5-tel szemben kódolási feladatokhoz, annak ellenére, hogy a Sonnet olcsóbb szint. A Sonnet 4.6 különösen erős a kódgenerálásban, utasításkövetésben és hibakeresésben. A legigényesebb feladatokhoz a Claude Opus 4.6 továbbra is vezet a benchmarkokban, mint a Terminal-Bench 2.0.
Mi az a Claude Sonnet 4.6 számítógép-használat?
A számítógép-használat lehetővé teszi, hogy a Claude emberként kezelje a szoftvereket: gombokat nyomjon, űrlapokat töltsön ki és felhasználói felületeken navigáljon. Az OSWorld-ön, a számítógép-használat standard benchmarkján, a Sonnet 4.6 65%-kal magasabb pontszámot ér el, mint az eredeti Sonnet 3.5 alapvonal 2024 októberéből. Jelentősen javult prompt injection ellenállása is, hasonlóan teljesítve a drágább Opus 4.6-hoz.

Maradjon naprakész

Kapja meg a legfrissebb AI híreket e-mailben.

Megosztás