Apa yang Baharu dalam Claude Sonnet 4.6
Claude Sonnet 4.6 ialah model Sonnet paling berkemampuan Anthropic, dengan peningkatan besar dalam pengekodan, computer use, penaakulan konteks panjang, dan perancangan agen. Ia kini menjadi model lalai pada claude.ai untuk pengguna Free dan Pro.
Pembangun dengan akses awal memilih Sonnet 4.6 dengan margin yang besar berbanding pendahulunya, dan sering juga berbanding Claude Opus 4.5, model paling bijak Anthropic dari November 2025.
Prestasi Pengekodan Claude Sonnet 4.6
Prestasi yang sebelumnya memerlukan model kelas Opus kini tersedia pada harga Sonnet ($3/$15 per juta token). Peningkatan utama:
- Penjanaan kod lebih baik: Output kod yang lebih konsisten dan tepat merentas bahasa
- Pengikutan arahan yang diperbaiki: Mengikut arahan pengekodan berbilang langkah yang kompleks dengan lebih tepat
- Penyahpepijatan lebih kuat: Lebih baik menangkap kesilapan sendiri dan mencadangkan pembaikan
- Prestasi tugas dunia sebenar: Terkini dalam tugas pejabat bernilai ekonomi (GDPval-AA)
Untuk pasukan yang menggunakan pengimbasan keselamatan berkuasa AI, Claude Code Security berfungsi dengan kedua-dua Sonnet 4.6 dan Opus 4.6 untuk mengesan kelemahan dalam pangkalan kod.
Penanda Aras Computer Use: Keputusan OSWorld
Anthropic mempelopori computer use tujuan umum pada Oktober 2024. Pada OSWorld, penanda aras standard di mana AI menyelesaikan tugas merentas perisian sebenar seperti Chrome, VS Code, dan LibreOffice, model Sonnet menunjukkan peningkatan berterusan selama 16 bulan:
| Model | Skor OSWorld |
|---|---|
| Sonnet 3.5 (Okt 2024) | Garis dasar |
| Sonnet 3.6 | +15% |
| Sonnet 4.5 | +40% |
| Sonnet 4.6 | +65% |
Pengguna awal melaporkan keupayaan setara manusia pada tugas seperti menavigasi hamparan data kompleks, mengisi borang web berbilang langkah, dan bekerja merentas berbilang tab pelayar.
Rintangan Suntikan Prompt
Computer use mendedahkan risiko keselamatan daripada serangan suntikan prompt di laman web. Sonnet 4.6 menunjukkan peningkatan besar dalam rintangan suntikan berbanding Sonnet 4.5, berprestasi serupa dengan Opus 4.6 yang lebih mahal.
Tetingkap Konteks 1M Token
Sonnet 4.6 mempunyai tetingkap konteks 1M token dalam beta, mencukupi untuk memproses keseluruhan pangkalan kod, dokumen panjang, atau sejarah perbualan yang luas dalam satu permintaan.
Apa Makna Claude Sonnet 4.6 untuk Pembangun
Bagi pembangun, Sonnet 4.6 mewakili peningkatan kecekapan kos yang ketara. Tugas yang sebelumnya memerlukan model kelas Opus (pada $5/$25 per juta token) kini berprestasi setara pada harga Sonnet. Ini menjadikan pembangunan berkuasa AI lebih mudah diakses untuk:
- Aliran kerja pengekodan agentik: Sesi pengekodan automatik yang lebih panjang dan dipercayai
- Semakan kod dan penyahpepijatan: Menangkap isu sebelum mencapai pengeluaran
- Automasi computer use: Mengautomatikkan interaksi perisian warisan
- Analisis pangkalan kod besar: Menggunakan tetingkap konteks 1M untuk memahami keseluruhan projek
Soalan Lazim
Apakah Claude Sonnet 4.6?
Berapakah kos Claude Sonnet 4.6?
Adakah Claude Sonnet 4.6 lebih baik daripada Opus 4.5 untuk pengekodan?
Apakah computer use Claude Sonnet 4.6?
Kekal Dikemas Kini
Dapatkan berita AI terkini dalam peti masuk anda.
