Code Velocity
Tekoälymallit

Claude Sonnet 4.6: Eturintaman koodausta Sonnet-hinnalla

·6 min lukuaika·Anthropic·Alkuperäinen lähde
Jaa
Claude Sonnet 4.6:n OSWorld-suorituskykytestin kehitys, jossa näkyy 65 %:n parannus Sonnet 3.5:stä 4.6:een

Mitä uutta Claude Sonnet 4.6:ssa

Claude Sonnet 4.6 on Anthropicin kyvykkäin Sonnet-malli, jossa on merkittäviä parannuksia koodauksessa, tietokoneen käytössä, pitkän kontekstin päättelyssä ja agenttisessa suunnittelussa. Se on nyt oletusmalli claude.ai:ssa ilmais- ja Pro-käyttäjille.

Varhaiskäyttöoikeuden saaneet kehittäjät suosivat Sonnet 4.6:ta selvästi edeltäjäänsä, ja usein jopa Claude Opus 4.5:ttä, Anthropicin älykkäintä mallia marraskuulta 2025.

Claude Sonnet 4.6:n koodaussuorituskyky

Suorituskyky, joka aiemmin vaati Opus-luokan mallia, on nyt saatavilla Sonnet-hinnoittelulla ($3/$15 per miljoona tokenia). Keskeiset parannukset:

  • Parempi koodin generointi: Johdonmukaisempi ja tarkempi koodituloste eri kielillä
  • Parantunut ohjeiden noudattaminen: Seuraa monimutkaisia monivaiheisia koodausohjeita tarkemmin
  • Vahvempi virheenkorjaus: Parempi löytämään omia virheitään ja ehdottamaan korjauksia
  • Tosielämän tehtäväsuorituskyky: Huipputaso taloudellisesti arvokkaissa toimistotehtävissä (GDPval-AA)

Tekoälypohjaista tietoturvaskannausta käyttäville tiimeille Claude Code Security toimii sekä Sonnet 4.6:n että Opus 4.6:n kanssa haavoittuvuuksien tunnistamiseen koodikannoissa.

Tietokoneen käytön suorituskykytestit: OSWorld-tulokset

Anthropic oli edelläkävijä yleiskäyttöisessä tietokoneen käytössä lokakuussa 2024. OSWorldissa, standardisuorituskykytestissä, jossa tekoäly suorittaa tehtäviä oikeissa ohjelmistoissa kuten Chrome, VS Code ja LibreOffice, Sonnet-mallit ovat osoittaneet tasaista kehitystä 16 kuukauden aikana:

MalliOSWorld-pistemäärä
Sonnet 3.5 (lok. 2024)Lähtötaso
Sonnet 3.6+15 %
Sonnet 4.5+40 %
Sonnet 4.6+65 %

Varhaiset käyttäjät raportoivat ihmistason kyvykkyydestä tehtävissä kuten monimutkaisten taulukkolaskentojen navigoinnissa, monivaiheisten verkkolomakkeiden täyttämisessä ja useiden selainvälilehtien käsittelyssä.

Kehotusinjektiosuojaus

Tietokoneen käyttö aiheuttaa tietoturvariskejä verkkosivujen kehotusinjektiohyökkäyksistä. Sonnet 4.6 osoittaa merkittävää parannusta injektiosuojauksessa verrattuna Sonnet 4.5:een, suoriutuen samalla tasolla kuin kalliimpi Opus 4.6.

1M tokenin konteksti-ikkuna

Sonnet 4.6 sisältää 1M tokenin konteksti-ikkunan betana, mikä riittää kokonaisten koodikantojen, pitkien dokumenttien tai laajojen keskusteluhistorioiden käsittelyyn yhdessä pyynnössä.

Mitä Claude Sonnet 4.6 merkitsee kehittäjille

Kehittäjille Sonnet 4.6 edustaa merkittävää kustannustehokkuuden parannusta. Tehtävät, jotka aiemmin vaativat Opus-luokan malleja (hintaan $5/$25 per miljoona tokenia), suoriutuvat nyt vastaavasti Sonnet-hinnoittelulla. Tämä tekee tekoälypohjaisesta kehityksestä saavutettavampaa:

  • Agenttiset koodaustyöprosessit: Pidemmät ja luotettavammat automatisoidut koodaussessiot
  • Koodiarviointi ja virheenkorjaus: Ongelmien havaitseminen ennen tuotantoon pääsyä
  • Tietokoneen käytön automatisointi: Vanhojen ohjelmistojen vuorovaikutusten automatisointi
  • Suurten koodikantojen analyysi: 1M konteksti-ikkunan käyttö kokonaisten projektien ymmärtämiseen

Usein kysytyt kysymykset

Mikä on Claude Sonnet 4.6?
Claude Sonnet 4.6 on Anthropicin kyvykkäin Sonnet-tason malli, julkaistu helmikuussa 2026. Se tarjoaa koodaus- ja päättelysuorituskykyä, joka aiemmin vaati Opus-luokan malleja, mutta Sonnet-hinnoittelulla ($3/$15 per miljoona tokenia). Se on nyt oletusmalli claude.ai:ssa ilmais- ja Pro-käyttäjille, ja sisältää 1M tokenin konteksti-ikkunan betana.
Paljonko Claude Sonnet 4.6 maksaa?
Claude Sonnet 4.6 maksaa $3 per miljoona syötetokenia ja $15 per miljoona tulostetokenia, sama kuin Sonnet 4.5. Tämä on 40 % edullisempi kuin Opus-hinnoittelu ($5/$25). Se on saatavilla claude.ai:ssa, Anthropic API:ssa model ID:llä claude-sonnet-4-6, Amazon Bedrockissa ja Google Cloud Vertex AI:ssa.
Onko Claude Sonnet 4.6 parempi kuin Opus 4.5 koodauksessa?
Kyllä. Varhaiskäyttöoikeuden saaneet kehittäjät suosivat usein Sonnet 4.6:ta Claude Opus 4.5:n sijaan koodaustehtävissä, vaikka Sonnet on edullisempi taso. Sonnet 4.6 on erityisen vahva koodin generoinnissa, ohjeiden noudattamisessa ja virheenkorjauksessa. Vaativimmissa tehtävissä Claude Opus 4.6 johtaa edelleen suorituskykytesteissä kuten Terminal-Bench 2.0.
Mikä on Claude Sonnet 4.6:n tietokoneen käyttö?
Tietokoneen käyttö mahdollistaa Clauden vuorovaikutuksen ohjelmistojen kanssa kuten ihminen: painikkeiden klikkaaminen, lomakkeiden täyttäminen ja käyttöliittymien navigointi. OSWorldissa, tietokoneen käytön standardisuorituskykytestissä, Sonnet 4.6 saa 65 % korkeamman pistemäärän kuin alkuperäinen Sonnet 3.5 -lähtötaso lokakuulta 2024. Sillä on myös merkittävästi parantunut kehotusinjektiosuojaus, joka vastaa kalliimman Opus 4.6:n suorituskykyä.

Pysy ajan tasalla

Saa uusimmat tekoälyuutiset sähköpostiisi.

Jaa