Co nowego w Claude Sonnet 4.6
Claude Sonnet 4.6 to najpotężniejszy model Sonnet od Anthropic, z istotnymi ulepszeniami w programowaniu, computer use, rozumowaniu na długim kontekście i planowaniu agentowym. Jest teraz domyślnym modelem na claude.ai dla użytkowników Free i Pro.
Deweloperzy z wczesnym dostępem zdecydowanie preferują Sonnet 4.6 nad poprzednikiem, a często nawet nad Claude Opus 4.5, najinteligentniejszym modelem Anthropic z listopada 2025 roku.
Wydajność programistyczna Claude Sonnet 4.6
Wydajność, która wcześniej wymagała modelu klasy Opus, jest teraz dostępna w cenie Sonnet ($3/$15 za milion tokenów). Kluczowe ulepszenia:
- Lepsza generacja kodu: Bardziej spójne i dokładne wyjście kodu we wszystkich językach
- Ulepszone wykonywanie instrukcji: Dokładniejsze realizowanie złożonych wieloetapowych instrukcji programistycznych
- Silniejsze debugowanie: Lepsze wykrywanie własnych błędów i proponowanie poprawek
- Wydajność na zadaniach rzeczywistych: Najnowocześniejsze wyniki na ekonomicznie wartościowych zadaniach biurowych (GDPval-AA)
Dla zespołów korzystających ze skanowania bezpieczeństwa opartego na AI, Claude Code Security działa zarówno z Sonnet 4.6, jak i Opus 4.6 do wykrywania podatności w bazach kodu.
Benchmarki Computer Use: wyniki OSWorld
Anthropic był pionierem ogólnego computer use w październiku 2024. Na OSWorld, standardowym benchmarku, gdzie AI wykonuje zadania w prawdziwym oprogramowaniu jak Chrome, VS Code i LibreOffice, modele Sonnet wykazały stały postęp przez 16 miesięcy:
| Model | Wynik OSWorld |
|---|---|
| Sonnet 3.5 (paź 2024) | Bazowy |
| Sonnet 3.6 | +15% |
| Sonnet 4.5 | +40% |
| Sonnet 4.6 | +65% |
Wcześni użytkownicy raportują możliwości na poziomie człowieka w zadaniach takich jak nawigacja po złożonych arkuszach kalkulacyjnych, wypełnianie wieloetapowych formularzy internetowych i praca z wieloma kartami przeglądarki.
Odporność na prompt injection
Computer use wiąże się z ryzykami bezpieczeństwa ze strony ataków prompt injection na stronach internetowych. Sonnet 4.6 wykazuje znaczną poprawę odporności na injection w porównaniu z Sonnet 4.5, osiągając wyniki zbliżone do droższego Opus 4.6.
Okno kontekstowe 1M tokenów
Sonnet 4.6 posiada okno kontekstowe 1M tokenów w wersji beta — wystarczające do przetwarzania całych baz kodu, długich dokumentów lub rozbudowanych historii rozmów w jednym zapytaniu.
Co Claude Sonnet 4.6 oznacza dla deweloperów
Dla deweloperów Sonnet 4.6 oznacza znaczącą poprawę efektywności kosztowej. Zadania, które wcześniej wymagały modeli klasy Opus ($5/$25 za milion tokenów), teraz osiągają porównywalną wydajność w cenie Sonnet. Czyni to programowanie wspomagane AI bardziej dostępnym dla:
- Agentowych procesów programowania: Dłuższe i bardziej niezawodne automatyczne sesje programistyczne
- Przeglądu kodu i debugowania: Wykrywanie problemów przed wdrożeniem na produkcję
- Automatyzacji computer use: Automatyzacja interakcji z legacy software
- Analizy dużych baz kodu: Wykorzystanie kontekstu 1M do zrozumienia całych projektów
Źródło oryginalne
https://www.anthropic.com/news/claude-sonnet-4-6Często zadawane pytania
Czym jest Claude Sonnet 4.6?
Ile kosztuje Claude Sonnet 4.6?
Czy Claude Sonnet 4.6 jest lepszy od Opus 4.5 do programowania?
Czym jest computer use w Claude Sonnet 4.6?
Bądź na bieżąco
Otrzymuj najnowsze wiadomości o AI na swoją skrzynkę.
