Resulta ng Benchmark ng GPT-5.2-Codex
Inilabas ng OpenAI ang GPT-5.2-Codex noong Enero 14, 2026, limang linggo pagkatapos ng base GPT-5.2 model. Nakatutok ito sa agentic coding: multi-step session kung saan nagpaplano ang modelo, nagsusulat ng code, nagpapatakbo ng mga test, at nag-i-iterate sa mga pagkabigo.
Nakakuha ang modelo ng 56.4% sa SWE-Bench Pro (mula sa 55.6% ng base GPT-5.2) at 64.0% sa Terminal-Bench 2.0 (mula sa 62.2%). Parehong benchmark ang sumusubok ng real-world coding task, hindi isolated code generation.
GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6
| Benchmark | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | 56.4% | 55.6% | — |
| Terminal-Bench 2.0 | 64.0% | 62.2% | #1 |
| Context Window (input) | 400K | 128K | 200K (1M beta) |
| Output Tokens | 128K | 128K | 128K |
Binabalanse ng GPT-5.2-Codex ang gastos at performance. Nangunguna ang Claude Opus 4.6 sa Terminal-Bench 2.0 at Humanity's Last Exam, habang nakikipagkumpitensya ang GPT-5.2-Codex sa presyo at laki ng context window.
Mga Pangunahing Feature para sa mga Developer
Context Compaction
Tulad ng context compaction feature ng Claude Opus 4.6, kino-compress ng GPT-5.2-Codex ang mas naunang context habang pinapanatili ang task state. Pinapayagan nito ang multi-hour coding session kung saan sinusubaybayan ng modelo ang buong proyekto kahit na lumampas na ang usapan sa context window.
Pagkumpleto ng Long-Horizon Task
Ang modelo ay naka-optimize para sa mga task na may maraming hakbang: malalaking refactor, codebase migration, at multi-file feature implementation. Kapag nabigo ang isang diskarte, nag-a-adjust at nagre-retry ang GPT-5.2-Codex sa halip na i-restart ang task.
Built-In Vulnerability Detection
Kasama sa GPT-5.2-Codex ang vulnerability detection habang nagsusulat ng code. Ang mga team na nangangailangan ng mas malalim na pag-scan ay maaaring gumamit ng mga nakalaang tool tulad ng Claude Code Security, na nag-aalok ng multi-stage verification na may false positive filtering.
Suporta sa Windows Environment
Pinahusay ng OpenAI ang performance ng GPT-5.2-Codex sa Windows development, na tumutugon sa Unix-centric optimization ng mga naunang modelo.
Presyo ng GPT-5.2-Codex
| Tier | Gastos bawat Milyong Token |
|---|---|
| Input | $1.75 |
| Output | $14.00 |
| Cached Input | $0.175 (90% diskwento) |
Available ang GPT-5.2-Codex sa lahat ng Codex surface para sa bayad na ChatGPT user at bilang standalone API model.
Ano ang Ibig Sabihin ng GPT-5.2-Codex para sa Agentic Coding
Ang release na ito ay sumasalamin sa industriya-wide na pagbabago mula sa code completion patungo sa tuloy-tuloy na coding agent. Ang Codex ng OpenAI, Claude Code ng Anthropic, at GitHub Agentic Workflows ay lahat nakatutok sa multi-step engineering task na may minimal na human intervention.
Orihinal na pinagmulan
https://openai.com/index/introducing-gpt-5-2-codex/Mga Karaniwang Tanong
Ano ang GPT-5.2-Codex?
Magkano ang GPT-5.2-Codex?
Ano ang context compaction sa GPT-5.2-Codex?
Paano ang GPT-5.2-Codex kumpara sa Claude Opus 4.6?
Manatiling Updated
Kunin ang pinakabagong AI news sa iyong inbox.
