Keputusan Penanda Aras GPT-5.2-Codex
OpenAI mengeluarkan GPT-5.2-Codex pada 14 Januari 2026, lima minggu selepas model asas GPT-5.2. Ia menyasarkan pengekodan agentik: sesi berbilang langkah di mana model merancang, menulis kod, menjalankan ujian, dan mengulangi kegagalan.
Model ini mencatat 56.4% pada SWE-Bench Pro (naik daripada 55.6% pada GPT-5.2 asas) dan 64.0% pada Terminal-Bench 2.0 (naik daripada 62.2%). Kedua-dua penanda aras menguji tugas pengekodan dunia sebenar, bukan penjanaan kod terpencil.
GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6
| Penanda Aras | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | 56.4% | 55.6% | — |
| Terminal-Bench 2.0 | 64.0% | 62.2% | #1 |
| Tetingkap Konteks (input) | 400K | 128K | 200K (1M beta) |
| Token Output | 128K | 128K | 128K |
GPT-5.2-Codex mengimbangi kos dan prestasi. Claude Opus 4.6 mendahului Terminal-Bench 2.0 dan Humanity's Last Exam, manakala GPT-5.2-Codex bersaing dari segi harga dan saiz tetingkap konteks.
Ciri Utama untuk Pembangun
Pemadatan Konteks
Seperti ciri pemadatan Claude Opus 4.6, GPT-5.2-Codex memampatkan konteks terdahulu sambil mengekalkan keadaan tugas. Ini membolehkan sesi pengekodan berjam-jam di mana model menjejaki keseluruhan projek walaupun perbualan melebihi tetingkap konteks.
Penyiapan Tugas Jangka Panjang
Model ini dioptimumkan untuk tugas merangkumi banyak langkah: pemfaktoran semula besar, migrasi pangkalan kod, dan pelaksanaan ciri berbilang fail. Apabila pendekatan gagal, GPT-5.2-Codex menyesuaikan dan mencuba semula dan bukannya memulakan semula tugas.
Pengesanan Kelemahan Terbina Dalam
GPT-5.2-Codex termasuk pengesanan kelemahan semasa penjanaan kod. Pasukan yang memerlukan pengimbasan lebih mendalam boleh menggunakan alat khusus seperti Claude Code Security, yang menawarkan pengesahan berbilang peringkat dengan penapisan positif palsu.
Sokongan Persekitaran Windows
OpenAI meningkatkan prestasi pembangunan Windows GPT-5.2-Codex, menangani pengoptimuman berpusatkan Unix pada model terdahulu.
Harga GPT-5.2-Codex
| Peringkat | Kos per Juta Token |
|---|---|
| Input | $1.75 |
| Output | $14.00 |
| Input Dicache | $0.175 (diskaun 90%) |
GPT-5.2-Codex tersedia merentas semua permukaan Codex untuk pengguna ChatGPT berbayar dan sebagai model API kendiri.
Apa Makna GPT-5.2-Codex untuk Pengekodan Agentik
Keluaran ini mencerminkan peralihan seluruh industri daripada pelengkapan kod kepada agen pengekodan berterusan. Codex OpenAI, Claude Code Anthropic, dan GitHub Agentic Workflows semuanya menyasarkan tugas kejuruteraan berbilang langkah dengan campur tangan manusia yang minimum.
Soalan Lazim
Apakah itu GPT-5.2-Codex?
Berapakah kos GPT-5.2-Codex?
Apakah pemadatan konteks dalam GPT-5.2-Codex?
Bagaimanakah GPT-5.2-Codex berbanding dengan Claude Opus 4.6?
Kekal Dikemas Kini
Dapatkan berita AI terkini dalam peti masuk anda.
