Novinky v Claude Sonnet 4.6
Claude Sonnet 4.6 je nejschopnější model Sonnet od Anthropic s významnými vylepšeními v kódování, computer use, uvažování s dlouhým kontextem a plánování agentů. Je nyní výchozím modelem na claude.ai pro uživatele Free a Pro.
Vývojáři s předčasným přístupem preferují Sonnet 4.6 před svým předchůdcem s velkým náskokem, a často dokonce i před Claude Opus 4.5, nejchytřejším modelem Anthropic z listopadu 2025.
Výkon kódování Claude Sonnet 4.6
Výkon, který dříve vyžadoval model třídy Opus, je nyní dostupný za cenu Sonnet ($3/$15 za milion tokenů). Klíčová vylepšení:
- Lepší generování kódu: Konzistentnější a přesnější výstup kódu napříč jazyky
- Vylepšené dodržování instrukcí: Přesněji sleduje složité vícekrokové kódovací instrukce
- Silnější debugování: Lépe zachycuje vlastní chyby a navrhuje opravy
- Výkon v reálných úlohách: Nejlepší výsledky na ekonomicky hodnotných kancelářských úlohách (GDPval-AA)
Pro týmy využívající AI bezpečnostní skenování funguje Claude Code Security s oběma modely Sonnet 4.6 i Opus 4.6 pro detekci zranitelností v kódových bázích.
Benchmarky Computer Use: Výsledky OSWorld
Anthropic byl průkopníkem obecného computer use v říjnu 2024. Na OSWorld, standardním benchmarku, kde AI provádí úlohy v reálném softwaru jako Chrome, VS Code a LibreOffice, modely Sonnet vykazují postupné zlepšování během 16 měsíců:
| Model | Skóre OSWorld |
|---|---|
| Sonnet 3.5 (říjen 2024) | Baseline |
| Sonnet 3.6 | +15 % |
| Sonnet 4.5 | +40 % |
| Sonnet 4.6 | +65 % |
Raní uživatelé hlásí lidskou úroveň schopností v úlohách jako navigace ve složitých tabulkách, vyplňování vícekrokových webových formulářů a práce napříč více kartami prohlížeče.
Odolnost proti Prompt Injection
Computer use přináší bezpečnostní rizika z prompt injection útoků na webových stránkách. Sonnet 4.6 vykazuje zásadní zlepšení odolnosti proti injection ve srovnání se Sonnet 4.5, s výkonem srovnatelným s dražším Opus 4.6.
Kontextové okno 1M tokenů
Sonnet 4.6 disponuje kontextovým oknem 1M tokenů v beta verzi, dostatečným pro zpracování celých kódových bází, dlouhých dokumentů nebo rozsáhlých historií konverzací v jednom požadavku.
Co Claude Sonnet 4.6 znamená pro vývojáře
Pro vývojáře představuje Sonnet 4.6 významné zlepšení nákladové efektivity. Úlohy, které dříve vyžadovaly modely třídy Opus (za $5/$25 za milion tokenů), nyní podávají srovnatelný výkon za cenu Sonnet. To činí vývoj poháněný AI přístupnějším pro:
- Agentické kódovací pracovní postupy: Delší a spolehlivější automatizované kódovací relace
- Revize a debugování kódu: Zachycení problémů před tím, než se dostanou do produkce
- Automatizace computer use: Automatizace interakce se zastaralým softwarem
- Analýza velkých kódových bází: Využití kontextového okna 1M k pochopení celých projektů
Původní zdroj
https://www.anthropic.com/news/claude-sonnet-4-6Často kladené dotazy
Co je Claude Sonnet 4.6?
Kolik stojí Claude Sonnet 4.6?
Je Claude Sonnet 4.6 lepší než Opus 4.5 pro kódování?
Co je Claude Sonnet 4.6 computer use?
Buďte v obraze
Dostávejte nejnovější AI zprávy do schránky.
