Code Velocity
AI modely

Claude Sonnet 4.6: Frontier kódování za cenu Sonnet

·6 min čtení·Anthropic·Původní zdroj
Sdílet
Vývoj benchmarku OSWorld pro Claude Sonnet 4.6 zobrazující 65% zlepšení od Sonnet 3.5 po 4.6

Novinky v Claude Sonnet 4.6

Claude Sonnet 4.6 je nejschopnější model Sonnet od Anthropic s významnými vylepšeními v kódování, computer use, uvažování s dlouhým kontextem a plánování agentů. Je nyní výchozím modelem na claude.ai pro uživatele Free a Pro.

Vývojáři s předčasným přístupem preferují Sonnet 4.6 před svým předchůdcem s velkým náskokem, a často dokonce i před Claude Opus 4.5, nejchytřejším modelem Anthropic z listopadu 2025.

Výkon kódování Claude Sonnet 4.6

Výkon, který dříve vyžadoval model třídy Opus, je nyní dostupný za cenu Sonnet ($3/$15 za milion tokenů). Klíčová vylepšení:

  • Lepší generování kódu: Konzistentnější a přesnější výstup kódu napříč jazyky
  • Vylepšené dodržování instrukcí: Přesněji sleduje složité vícekrokové kódovací instrukce
  • Silnější debugování: Lépe zachycuje vlastní chyby a navrhuje opravy
  • Výkon v reálných úlohách: Nejlepší výsledky na ekonomicky hodnotných kancelářských úlohách (GDPval-AA)

Pro týmy využívající AI bezpečnostní skenování funguje Claude Code Security s oběma modely Sonnet 4.6 i Opus 4.6 pro detekci zranitelností v kódových bázích.

Benchmarky Computer Use: Výsledky OSWorld

Anthropic byl průkopníkem obecného computer use v říjnu 2024. Na OSWorld, standardním benchmarku, kde AI provádí úlohy v reálném softwaru jako Chrome, VS Code a LibreOffice, modely Sonnet vykazují postupné zlepšování během 16 měsíců:

ModelSkóre OSWorld
Sonnet 3.5 (říjen 2024)Baseline
Sonnet 3.6+15 %
Sonnet 4.5+40 %
Sonnet 4.6+65 %

Raní uživatelé hlásí lidskou úroveň schopností v úlohách jako navigace ve složitých tabulkách, vyplňování vícekrokových webových formulářů a práce napříč více kartami prohlížeče.

Odolnost proti Prompt Injection

Computer use přináší bezpečnostní rizika z prompt injection útoků na webových stránkách. Sonnet 4.6 vykazuje zásadní zlepšení odolnosti proti injection ve srovnání se Sonnet 4.5, s výkonem srovnatelným s dražším Opus 4.6.

Kontextové okno 1M tokenů

Sonnet 4.6 disponuje kontextovým oknem 1M tokenů v beta verzi, dostatečným pro zpracování celých kódových bází, dlouhých dokumentů nebo rozsáhlých historií konverzací v jednom požadavku.

Co Claude Sonnet 4.6 znamená pro vývojáře

Pro vývojáře představuje Sonnet 4.6 významné zlepšení nákladové efektivity. Úlohy, které dříve vyžadovaly modely třídy Opus (za $5/$25 za milion tokenů), nyní podávají srovnatelný výkon za cenu Sonnet. To činí vývoj poháněný AI přístupnějším pro:

  • Agentické kódovací pracovní postupy: Delší a spolehlivější automatizované kódovací relace
  • Revize a debugování kódu: Zachycení problémů před tím, než se dostanou do produkce
  • Automatizace computer use: Automatizace interakce se zastaralým softwarem
  • Analýza velkých kódových bází: Využití kontextového okna 1M k pochopení celých projektů

Často kladené dotazy

Co je Claude Sonnet 4.6?
Claude Sonnet 4.6 je nejschopnější model úrovně Sonnet od Anthropic, vydaný v únoru 2026. Přináší výkon v kódování a uvažování, který dříve vyžadoval modely třídy Opus, ale za cenu Sonnet ($3/$15 za milion tokenů). Je nyní výchozím modelem na claude.ai pro uživatele Free a Pro a zahrnuje kontextové okno 1M tokenů v beta verzi.
Kolik stojí Claude Sonnet 4.6?
Claude Sonnet 4.6 stojí $3 za milion vstupních tokenů a $15 za milion výstupních tokenů, stejně jako Sonnet 4.5. To je o 40 % levnější než cena Opus ($5/$25). Je dostupný na claude.ai, přes API Anthropic s model ID claude-sonnet-4-6, Amazon Bedrock a Google Cloud Vertex AI.
Je Claude Sonnet 4.6 lepší než Opus 4.5 pro kódování?
Ano. Vývojáři s předčasným přístupem často preferovali Sonnet 4.6 před Claude Opus 4.5 pro kódovací úlohy, přestože Sonnet je levnější úroveň. Sonnet 4.6 vykazuje zvláštní sílu v generování kódu, dodržování instrukcí a debugování. Pro nejnáročnější úlohy stále vede Claude Opus 4.6 na benchmarcích jako Terminal-Bench 2.0.
Co je Claude Sonnet 4.6 computer use?
Computer use umožňuje Claude interagovat se softwarem jako člověk – klikat na tlačítka, vyplňovat formuláře a navigovat uživatelská rozhraní. Na OSWorld, standardním benchmarku pro computer use, dosahuje Sonnet 4.6 o 65 % vyššího skóre než původní baseline Sonnet 3.5 z října 2024. Má také výrazně vylepšenou odolnost proti prompt injection, s výkonem srovnatelným s dražším Opus 4.6.

Buďte v obraze

Dostávejte nejnovější AI zprávy do schránky.

Sdílet