Nini Kipya katika Claude Sonnet 4.6
Claude Sonnet 4.6 ni modeli yenye uwezo zaidi ya Sonnet ya Anthropic, yenye maboresho makubwa katika coding, computer use, kufikiri kwa muktadha mrefu, na upangaji wa mawakala. Sasa ni modeli ya kawaida kwenye claude.ai kwa watumiaji wa Free na Pro.
Watengenezaji walio na upatikanaji wa mapema wanapendelea Sonnet 4.6 kuliko mtangulizi wake kwa kiwango kikubwa, na mara nyingi hata kuliko Claude Opus 4.5, modeli ya akili zaidi ya Anthropic kutoka Novemba 2025.
Utendaji wa Coding wa Claude Sonnet 4.6
Utendaji ambao hapo awali ulihitaji modeli ya daraja la Opus sasa unapatikana kwa bei ya Sonnet ($3/$15 kwa tokeni milioni moja). Maboresho muhimu:
- Uzalishaji bora wa msimbo: Matokeo thabiti na sahihi zaidi ya msimbo katika lugha nyingi
- Kufuata maagizo bora: Kufuata kwa usahihi zaidi maagizo changamani ya coding ya hatua nyingi
- Utatuzi wa hitilafu wenye nguvu: Bora zaidi katika kukamata makosa yake na kupendekeza marekebisho
- Utendaji wa kazi halisi: Ya hali ya juu zaidi kwenye kazi za ofisi zenye thamani kiuchumi (GDPval-AA)
Kwa timu zinazotumia ukaguzi wa usalama unaotumia AI, Claude Code Security inafanya kazi na Sonnet 4.6 na Opus 4.6 kutambua udhaifu katika msingi wa msimbo.
Vipimo vya Computer Use: Matokeo ya OSWorld
Anthropic ilizindua computer use ya madhumuni ya jumla Oktoba 2024. Kwenye OSWorld, kipimo cha kawaida ambapo AI inakamilisha kazi kwenye programu halisi kama Chrome, VS Code, na LibreOffice, modeli za Sonnet zimeonyesha uboreshaji thabiti kwa miezi 16:
| Modeli | Alama ya OSWorld |
|---|---|
| Sonnet 3.5 (Okt 2024) | Msingi |
| Sonnet 3.6 | +15% |
| Sonnet 4.5 | +40% |
| Sonnet 4.6 | +65% |
Watumiaji wa mapema wanaripoti uwezo wa kiwango cha binadamu kwenye kazi kama kuvinjari lahajedwali changamani, kujaza fomu za wavuti za hatua nyingi, na kufanya kazi kwenye tabo nyingi za kivinjari.
Upinzani wa Prompt Injection
Computer use inaleta hatari za usalama kutoka kwa mashambulizi ya prompt injection kwenye tovuti. Sonnet 4.6 inaonyesha uboreshaji mkubwa katika upinzani wa injection ikilinganishwa na Sonnet 4.5, ikifanya kazi kwa kiwango sawa na Opus 4.6 ya bei ya juu zaidi.
Dirisha la Muktadha la Tokeni 1M
Sonnet 4.6 ina dirisha la muktadha la tokeni 1M katika beta, ya kutosha kuchakata msingi mzima wa msimbo, nyaraka ndefu, au historia pana za mazungumzo katika ombi moja.
Claude Sonnet 4.6 Inamaanisha Nini kwa Watengenezaji
Kwa watengenezaji, Sonnet 4.6 inawakilisha uboreshaji mkubwa wa ufanisi wa gharama. Kazi ambazo hapo awali zilihitaji modeli za daraja la Opus (kwa $5/$25 kwa tokeni milioni moja) sasa zinafanya kazi kwa kiwango kinacholingana kwa bei ya Sonnet. Hii inafanya maendeleo yanayotumia AI kupatikana zaidi kwa:
- Mtiririko wa kazi wa agentic coding: Vikao virefu na vya kuaminika zaidi vya coding otomatiki
- Mapitio ya msimbo na utatuzi: Kukamata matatizo kabla ya kufikia uzalishaji
- Otomatiki ya computer use: Kuotomatisha mwingiliano wa programu za zamani
- Uchambuzi wa msingi mkubwa wa msimbo: Kutumia dirisha la muktadha la 1M kuelewa miradi mizima
Chanzo asili
https://www.anthropic.com/news/claude-sonnet-4-6Maswali Yanayoulizwa Mara kwa Mara
Claude Sonnet 4.6 ni nini?
Claude Sonnet 4.6 inagharimu kiasi gani?
Je, Claude Sonnet 4.6 ni bora kuliko Opus 4.5 kwa coding?
Computer use ya Claude Sonnet 4.6 ni nini?
Baki na Habari
Pokea habari za hivi karibuni za AI kwenye barua pepe yako.
