Code Velocity
Model AI

Claude Sonnet 4.6: Coding Frontier dengan Harga Sonnet

·6 mnt baca·Anthropic·Sumber asli
Bagikan
Progres benchmark OSWorld Claude Sonnet 4.6 menampilkan peningkatan 65% dari Sonnet 3.5 ke 4.6

Yang Baru di Claude Sonnet 4.6

Claude Sonnet 4.6 adalah model Sonnet paling mumpuni dari Anthropic, dengan peningkatan besar dalam coding, computer use, penalaran konteks panjang, dan perencanaan agen. Model ini kini menjadi model default di claude.ai untuk pengguna Free dan Pro.

Developer dengan akses awal lebih memilih Sonnet 4.6 daripada pendahulunya dengan selisih besar, dan bahkan sering kali lebih memilihnya daripada Claude Opus 4.5, model terpintar Anthropic dari November 2025.

Performa Coding Claude Sonnet 4.6

Performa yang sebelumnya membutuhkan model kelas Opus kini tersedia dengan harga Sonnet ($3/$15 per juta token). Peningkatan utama:

  • Pembuatan kode lebih baik: Output kode lebih konsisten dan akurat di berbagai bahasa pemrograman
  • Mengikuti instruksi lebih baik: Mengikuti instruksi coding multi-langkah yang kompleks dengan lebih presisi
  • Debugging lebih kuat: Lebih baik dalam menangkap kesalahannya sendiri dan menyarankan perbaikan
  • Performa tugas dunia nyata: Terdepan dalam tugas kantor bernilai ekonomi (GDPval-AA)

Untuk tim yang menggunakan pemindaian keamanan berbasis AI, Claude Code Security bekerja dengan Sonnet 4.6 maupun Opus 4.6 untuk mendeteksi kerentanan di codebase.

Benchmark Computer Use: Hasil OSWorld

Anthropic memelopori computer use serba guna pada Oktober 2024. Di OSWorld, benchmark standar di mana AI menyelesaikan tugas di perangkat lunak nyata seperti Chrome, VS Code, dan LibreOffice, model Sonnet menunjukkan peningkatan stabil selama 16 bulan:

ModelSkor OSWorld
Sonnet 3.5 (Okt 2024)Baseline
Sonnet 3.6+15%
Sonnet 4.5+40%
Sonnet 4.6+65%

Pengguna awal melaporkan kemampuan setara manusia pada tugas seperti menavigasi spreadsheet kompleks, mengisi formulir web multi-langkah, dan bekerja di beberapa tab browser.

Ketahanan Prompt Injection

Computer use menimbulkan risiko keamanan dari serangan prompt injection di situs web. Sonnet 4.6 menunjukkan peningkatan besar dalam ketahanan injeksi dibandingkan Sonnet 4.5, setara dengan Opus 4.6 yang lebih mahal.

Jendela Konteks 1M Token

Sonnet 4.6 memiliki jendela konteks 1M token dalam beta, cukup untuk memproses seluruh codebase, dokumen panjang, atau riwayat percakapan ekstensif dalam satu permintaan.

Arti Claude Sonnet 4.6 bagi Developer

Bagi developer, Sonnet 4.6 merepresentasikan peningkatan efisiensi biaya yang signifikan. Tugas yang sebelumnya membutuhkan model kelas Opus (dengan harga $5/$25 per juta token) kini berperforma sebanding dengan harga Sonnet. Ini membuat pengembangan berbasis AI lebih terjangkau untuk:

  • Alur kerja coding agentik: Sesi coding otomatis yang lebih panjang dan andal
  • Review kode dan debugging: Menangkap masalah sebelum sampai ke produksi
  • Otomasi computer use: Mengotomatisasi interaksi dengan perangkat lunak legacy
  • Analisis codebase besar: Menggunakan jendela konteks 1M untuk memahami seluruh proyek

Pertanyaan yang Sering Diajukan

Apa itu Claude Sonnet 4.6?
Claude Sonnet 4.6 adalah model tingkat Sonnet paling mumpuni dari Anthropic, dirilis Februari 2026. Model ini menghadirkan performa coding dan penalaran yang sebelumnya membutuhkan model kelas Opus, tetapi dengan harga Sonnet ($3/$15 per juta token). Model ini kini menjadi model default di claude.ai untuk pengguna Free dan Pro dan menyertakan jendela konteks 1M token dalam beta.
Berapa harga Claude Sonnet 4.6?
Claude Sonnet 4.6 berharga $3 per juta token input dan $15 per juta token output, sama dengan Sonnet 4.5. Ini 40% lebih murah dari harga Opus ($5/$25). Model ini tersedia di claude.ai, API Anthropic dengan model ID claude-sonnet-4-6, Amazon Bedrock, dan Google Cloud Vertex AI.
Apakah Claude Sonnet 4.6 lebih baik dari Opus 4.5 untuk coding?
Ya. Developer dengan akses awal sering kali lebih memilih Sonnet 4.6 daripada Claude Opus 4.5 untuk tugas coding, meskipun Sonnet adalah tingkat yang lebih murah. Sonnet 4.6 menunjukkan keunggulan khusus dalam pembuatan kode, mengikuti instruksi, dan debugging. Untuk tugas paling menuntut, Claude Opus 4.6 tetap memimpin di benchmark seperti Terminal-Bench 2.0.
Apa itu computer use Claude Sonnet 4.6?
Computer use memungkinkan Claude berinteraksi dengan perangkat lunak seperti manusia — mengklik tombol, mengisi formulir, dan menavigasi UI. Di OSWorld, benchmark standar untuk computer use, Sonnet 4.6 meraih skor 65% lebih tinggi dari baseline awal Sonnet 3.5 pada Oktober 2024. Model ini juga memiliki ketahanan prompt injection yang jauh lebih baik, setara dengan Opus 4.6 yang lebih mahal.

Tetap Update

Dapatkan berita AI terbaru di inbox Anda.

Bagikan