Yang Baru di Claude Sonnet 4.6
Claude Sonnet 4.6 adalah model Sonnet paling mumpuni dari Anthropic, dengan peningkatan besar dalam coding, computer use, penalaran konteks panjang, dan perencanaan agen. Model ini kini menjadi model default di claude.ai untuk pengguna Free dan Pro.
Developer dengan akses awal lebih memilih Sonnet 4.6 daripada pendahulunya dengan selisih besar, dan bahkan sering kali lebih memilihnya daripada Claude Opus 4.5, model terpintar Anthropic dari November 2025.
Performa Coding Claude Sonnet 4.6
Performa yang sebelumnya membutuhkan model kelas Opus kini tersedia dengan harga Sonnet ($3/$15 per juta token). Peningkatan utama:
- Pembuatan kode lebih baik: Output kode lebih konsisten dan akurat di berbagai bahasa pemrograman
- Mengikuti instruksi lebih baik: Mengikuti instruksi coding multi-langkah yang kompleks dengan lebih presisi
- Debugging lebih kuat: Lebih baik dalam menangkap kesalahannya sendiri dan menyarankan perbaikan
- Performa tugas dunia nyata: Terdepan dalam tugas kantor bernilai ekonomi (GDPval-AA)
Untuk tim yang menggunakan pemindaian keamanan berbasis AI, Claude Code Security bekerja dengan Sonnet 4.6 maupun Opus 4.6 untuk mendeteksi kerentanan di codebase.
Benchmark Computer Use: Hasil OSWorld
Anthropic memelopori computer use serba guna pada Oktober 2024. Di OSWorld, benchmark standar di mana AI menyelesaikan tugas di perangkat lunak nyata seperti Chrome, VS Code, dan LibreOffice, model Sonnet menunjukkan peningkatan stabil selama 16 bulan:
| Model | Skor OSWorld |
|---|---|
| Sonnet 3.5 (Okt 2024) | Baseline |
| Sonnet 3.6 | +15% |
| Sonnet 4.5 | +40% |
| Sonnet 4.6 | +65% |
Pengguna awal melaporkan kemampuan setara manusia pada tugas seperti menavigasi spreadsheet kompleks, mengisi formulir web multi-langkah, dan bekerja di beberapa tab browser.
Ketahanan Prompt Injection
Computer use menimbulkan risiko keamanan dari serangan prompt injection di situs web. Sonnet 4.6 menunjukkan peningkatan besar dalam ketahanan injeksi dibandingkan Sonnet 4.5, setara dengan Opus 4.6 yang lebih mahal.
Jendela Konteks 1M Token
Sonnet 4.6 memiliki jendela konteks 1M token dalam beta, cukup untuk memproses seluruh codebase, dokumen panjang, atau riwayat percakapan ekstensif dalam satu permintaan.
Arti Claude Sonnet 4.6 bagi Developer
Bagi developer, Sonnet 4.6 merepresentasikan peningkatan efisiensi biaya yang signifikan. Tugas yang sebelumnya membutuhkan model kelas Opus (dengan harga $5/$25 per juta token) kini berperforma sebanding dengan harga Sonnet. Ini membuat pengembangan berbasis AI lebih terjangkau untuk:
- Alur kerja coding agentik: Sesi coding otomatis yang lebih panjang dan andal
- Review kode dan debugging: Menangkap masalah sebelum sampai ke produksi
- Otomasi computer use: Mengotomatisasi interaksi dengan perangkat lunak legacy
- Analisis codebase besar: Menggunakan jendela konteks 1M untuk memahami seluruh proyek
Pertanyaan yang Sering Diajukan
Apa itu Claude Sonnet 4.6?
Berapa harga Claude Sonnet 4.6?
Apakah Claude Sonnet 4.6 lebih baik dari Opus 4.5 untuk coding?
Apa itu computer use Claude Sonnet 4.6?
Tetap Update
Dapatkan berita AI terbaru di inbox Anda.
