Hasil Benchmark GPT-5.2-Codex
OpenAI merilis GPT-5.2-Codex pada 14 Januari 2026, lima minggu setelah model dasar GPT-5.2. Model ini menargetkan coding agentik: sesi multi-langkah di mana model merencanakan, menulis kode, menjalankan pengujian, dan melakukan iterasi saat terjadi kegagalan.
Model ini meraih 56,4% di SWE-Bench Pro (naik dari 55,6% pada GPT-5.2 dasar) dan 64,0% di Terminal-Bench 2.0 (naik dari 62,2%). Kedua benchmark menguji tugas coding dunia nyata, bukan pembuatan kode secara terisolasi.
GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6
| Benchmark | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | 56,4% | 55,6% | — |
| Terminal-Bench 2.0 | 64,0% | 62,2% | #1 |
| Jendela Konteks (input) | 400K | 128K | 200K (1M beta) |
| Token Output | 128K | 128K | 128K |
GPT-5.2-Codex menyeimbangkan biaya dan performa. Claude Opus 4.6 memimpin di Terminal-Bench 2.0 dan Humanity's Last Exam, sementara GPT-5.2-Codex bersaing dalam hal harga dan ukuran jendela konteks.
Fitur Utama untuk Developer
Pemadatan Konteks
Seperti fitur pemadatan Claude Opus 4.6, GPT-5.2-Codex mengompresi konteks sebelumnya sambil mempertahankan status tugas. Ini memungkinkan sesi coding berjam-jam di mana model tetap melacak seluruh proyek meskipun percakapan melampaui jendela konteks.
Penyelesaian Tugas Jangka Panjang
Model ini dioptimalkan untuk tugas yang mencakup banyak langkah: refaktor besar, migrasi codebase, dan implementasi fitur multi-file. Saat suatu pendekatan gagal, GPT-5.2-Codex menyesuaikan dan mencoba ulang alih-alih memulai ulang tugas.
Deteksi Kerentanan Bawaan
GPT-5.2-Codex menyertakan deteksi kerentanan selama pembuatan kode. Tim yang membutuhkan pemindaian lebih mendalam dapat menggunakan alat khusus seperti Claude Code Security, yang menawarkan verifikasi multi-tahap dengan penyaringan false positive.
Dukungan Lingkungan Windows
OpenAI meningkatkan performa pengembangan Windows pada GPT-5.2-Codex, mengatasi optimasi yang berpusat pada Unix dari model-model sebelumnya.
Harga GPT-5.2-Codex
| Tingkat | Biaya per Juta Token |
|---|---|
| Input | $1,75 |
| Output | $14,00 |
| Input yang Di-cache | $0,175 (diskon 90%) |
GPT-5.2-Codex tersedia di seluruh platform Codex untuk pengguna ChatGPT berbayar dan sebagai model API mandiri.
Arti GPT-5.2-Codex bagi Coding Agentik
Peluncuran ini mencerminkan pergeseran industri dari penyelesaian kode ke agen coding berkelanjutan. Codex dari OpenAI, Claude Code dari Anthropic, dan GitHub Agentic Workflows semuanya menargetkan tugas rekayasa multi-langkah dengan intervensi manusia minimal.
Pertanyaan yang Sering Diajukan
Apa itu GPT-5.2-Codex?
Berapa harga GPT-5.2-Codex?
Apa itu pemadatan konteks di GPT-5.2-Codex?
Bagaimana perbandingan GPT-5.2-Codex dengan Claude Opus 4.6?
Tetap Update
Dapatkan berita AI terbaru di inbox Anda.
