Code Velocity
Model AI

Claude Sonnet 4.6: Pengekodan Terdepan pada Harga Sonnet

·6 min bacaan·Anthropic·Sumber asal
Kongsi
Perkembangan penanda aras OSWorld Claude Sonnet 4.6 menunjukkan peningkatan 65% dari Sonnet 3.5 ke 4.6

Apa yang Baharu dalam Claude Sonnet 4.6

Claude Sonnet 4.6 ialah model Sonnet paling berkemampuan Anthropic, dengan peningkatan besar dalam pengekodan, computer use, penaakulan konteks panjang, dan perancangan agen. Ia kini menjadi model lalai pada claude.ai untuk pengguna Free dan Pro.

Pembangun dengan akses awal memilih Sonnet 4.6 dengan margin yang besar berbanding pendahulunya, dan sering juga berbanding Claude Opus 4.5, model paling bijak Anthropic dari November 2025.

Prestasi Pengekodan Claude Sonnet 4.6

Prestasi yang sebelumnya memerlukan model kelas Opus kini tersedia pada harga Sonnet ($3/$15 per juta token). Peningkatan utama:

  • Penjanaan kod lebih baik: Output kod yang lebih konsisten dan tepat merentas bahasa
  • Pengikutan arahan yang diperbaiki: Mengikut arahan pengekodan berbilang langkah yang kompleks dengan lebih tepat
  • Penyahpepijatan lebih kuat: Lebih baik menangkap kesilapan sendiri dan mencadangkan pembaikan
  • Prestasi tugas dunia sebenar: Terkini dalam tugas pejabat bernilai ekonomi (GDPval-AA)

Untuk pasukan yang menggunakan pengimbasan keselamatan berkuasa AI, Claude Code Security berfungsi dengan kedua-dua Sonnet 4.6 dan Opus 4.6 untuk mengesan kelemahan dalam pangkalan kod.

Penanda Aras Computer Use: Keputusan OSWorld

Anthropic mempelopori computer use tujuan umum pada Oktober 2024. Pada OSWorld, penanda aras standard di mana AI menyelesaikan tugas merentas perisian sebenar seperti Chrome, VS Code, dan LibreOffice, model Sonnet menunjukkan peningkatan berterusan selama 16 bulan:

ModelSkor OSWorld
Sonnet 3.5 (Okt 2024)Garis dasar
Sonnet 3.6+15%
Sonnet 4.5+40%
Sonnet 4.6+65%

Pengguna awal melaporkan keupayaan setara manusia pada tugas seperti menavigasi hamparan data kompleks, mengisi borang web berbilang langkah, dan bekerja merentas berbilang tab pelayar.

Rintangan Suntikan Prompt

Computer use mendedahkan risiko keselamatan daripada serangan suntikan prompt di laman web. Sonnet 4.6 menunjukkan peningkatan besar dalam rintangan suntikan berbanding Sonnet 4.5, berprestasi serupa dengan Opus 4.6 yang lebih mahal.

Tetingkap Konteks 1M Token

Sonnet 4.6 mempunyai tetingkap konteks 1M token dalam beta, mencukupi untuk memproses keseluruhan pangkalan kod, dokumen panjang, atau sejarah perbualan yang luas dalam satu permintaan.

Apa Makna Claude Sonnet 4.6 untuk Pembangun

Bagi pembangun, Sonnet 4.6 mewakili peningkatan kecekapan kos yang ketara. Tugas yang sebelumnya memerlukan model kelas Opus (pada $5/$25 per juta token) kini berprestasi setara pada harga Sonnet. Ini menjadikan pembangunan berkuasa AI lebih mudah diakses untuk:

  • Aliran kerja pengekodan agentik: Sesi pengekodan automatik yang lebih panjang dan dipercayai
  • Semakan kod dan penyahpepijatan: Menangkap isu sebelum mencapai pengeluaran
  • Automasi computer use: Mengautomatikkan interaksi perisian warisan
  • Analisis pangkalan kod besar: Menggunakan tetingkap konteks 1M untuk memahami keseluruhan projek

Soalan Lazim

Apakah Claude Sonnet 4.6?
Claude Sonnet 4.6 ialah model Sonnet paling berkemampuan Anthropic, dikeluarkan Februari 2026. Ia menyampaikan prestasi pengekodan dan penaakulan yang sebelumnya memerlukan model kelas Opus, tetapi pada harga Sonnet ($3/$15 per juta token). Ia kini menjadi model lalai pada claude.ai untuk pengguna Free dan Pro dan termasuk tetingkap konteks 1M token dalam beta.
Berapakah kos Claude Sonnet 4.6?
Claude Sonnet 4.6 berharga $3 per juta token input dan $15 per juta token output, sama seperti Sonnet 4.5. Ini 40% lebih murah daripada harga Opus ($5/$25). Ia tersedia di claude.ai, API Anthropic dengan ID model claude-sonnet-4-6, Amazon Bedrock, dan Google Cloud Vertex AI.
Adakah Claude Sonnet 4.6 lebih baik daripada Opus 4.5 untuk pengekodan?
Ya. Pembangun dengan akses awal kerap memilih Sonnet 4.6 berbanding Claude Opus 4.5 untuk tugas pengekodan, walaupun Sonnet adalah tahap yang lebih murah. Sonnet 4.6 menunjukkan kekuatan khusus dalam penjanaan kod, mengikuti arahan, dan penyahpepijatan. Untuk tugas yang paling mencabar, Claude Opus 4.6 masih mendahului pada penanda aras seperti Terminal-Bench 2.0.
Apakah computer use Claude Sonnet 4.6?
Computer use membolehkan Claude berinteraksi dengan perisian seperti manusia — mengklik butang, mengisi borang, dan menavigasi UI. Pada OSWorld, penanda aras standard untuk computer use, Sonnet 4.6 mencatat skor 65% lebih tinggi daripada garis dasar Sonnet 3.5 asal dari Oktober 2024. Ia juga mempunyai rintangan suntikan prompt yang jauh lebih baik, berprestasi serupa dengan Opus 4.6 yang lebih mahal.

Kekal Dikemas Kini

Dapatkan berita AI terkini dalam peti masuk anda.

Kongsi