Novosti v Claude Sonnet 4.6
Claude Sonnet 4.6 je najzmogljivejši model Sonnet od Anthropica z večjimi nadgradnjami kodiranja, uporabe računalnika, sklepanja v dolgem kontekstu in načrtovanja agentov. Zdaj je privzeti model na claude.ai za brezplačne in Pro uporabnike.
Razvijalci z zgodnjim dostopom dajejo Sonnet 4.6 prednost pred predhodnikom z veliko razliko in pogosto celo pred Claude Opus 4.5, najinteligentnejšim modelom Anthropica iz novembra 2025.
Zmogljivost kodiranja Claude Sonnet 4.6
Zmogljivost, ki je prej zahtevala model razreda Opus, je zdaj na voljo po ceni Sonnet ($3/$15 na milijon žetonov). Ključne izboljšave:
- Boljše generiranje kode: Bolj dosledno in natančno generiranje kode v različnih jezikih
- Izboljšano sledenje navodilom: Natančneje sledi zapletenim večstopenjskim navodilom za kodiranje
- Močnejše razhroščevanje: Boljše odkrivanje lastnih napak in predlaganje popravkov
- Zmogljivost pri realnih nalogah: Najsodobnejši rezultat pri ekonomsko dragocenih pisarniških nalogah (GDPval-AA)
Za ekipe, ki uporabljajo varnostno pregledovanje z UI, Claude Code Security deluje tako s Sonnet 4.6 kot Opus 4.6 za zaznavanje ranljivosti v kodnih bazah.
Merila uporabe računalnika: rezultati OSWorld
Anthropic je oktobra 2024 začel z uporabo računalnika za splošne namene. Na merilu OSWorld, standardnem testu, kjer UI dokončuje naloge v pravi programski opremi, kot so Chrome, VS Code in LibreOffice, so modeli Sonnet pokazali stalno izboljšavo v 16 mesecih:
| Model | Rezultat OSWorld |
|---|---|
| Sonnet 3.5 (okt. 2024) | Izhodišče |
| Sonnet 3.6 | +15 % |
| Sonnet 4.5 | +40 % |
| Sonnet 4.6 | +65 % |
Zgodnji uporabniki poročajo o zmogljivosti na ravni človeka pri nalogah, kot so navigacija po zapletenih preglednicah, izpolnjevanje večstopenjskih spletnih obrazcev in delo v več zavihkih brskalnika.
Odpornost na vrivanje pozivov
Uporaba računalnika prinaša varnostna tveganja zaradi napadov z vrivanjem pozivov na spletnih straneh. Sonnet 4.6 kaže veliko izboljšavo odpornosti na vrivanje v primerjavi s Sonnet 4.5, s podobno zmogljivostjo kot dražji Opus 4.6.
Kontekstno okno 1M žetonov
Sonnet 4.6 ima kontekstno okno 1M žetonov v beta različici — dovolj za obdelavo celotnih kodnih baz, dolgih dokumentov ali obsežnih zgodovin pogovorov v eni zahtevi.
Kaj Claude Sonnet 4.6 pomeni za razvijalce
Za razvijalce Sonnet 4.6 predstavlja pomembno izboljšavo stroškovne učinkovitosti. Naloge, ki so prej zahtevale modele razreda Opus (po $5/$25 na milijon žetonov), zdaj dosegajo primerljive rezultate po ceni Sonnet. To naredi razvoj z UI bolj dostopen za:
- Agentne delovne tokove kodiranja: Daljše in zanesljivejše avtomatizirane seje kodiranja
- Pregled in razhroščevanje kode: Odkrivanje težav, preden dosežejo produkcijo
- Avtomatizacijo uporabe računalnika: Avtomatizacija interakcij s starejšo programsko opremo
- Analizo velikih kodnih baz: Uporaba kontekstnega okna 1M za razumevanje celotnih projektov
Pogosta vprašanja
Kaj je Claude Sonnet 4.6?
Koliko stane Claude Sonnet 4.6?
Ali je Claude Sonnet 4.6 boljši od Opus 4.5 za kodiranje?
Kaj je uporaba računalnika pri Claude Sonnet 4.6?
Bodite na tekočem
Prejemajte najnovejše AI novice po e-pošti.
