Code Velocity
KI-modelle

GPT-5.2-Codex: OpenAI se Agentiese Koderingsmodel

·6 min lees·OpenAI·Oorspronklike bron
Deel
GPT-5.2-Codex maatstafgrafiek wat SWE-Bench Pro en Terminal-Bench 2.0 tellings toon in vergelyking met GPT-5.2 basismodel

GPT-5.2-Codex Maatstafresultate

OpenAI het GPT-5.2-Codex op 14 Januarie 2026 vrygestel, vyf weke na die basis GPT-5.2-model. Dit teiken agentiese kodering: meerstap-sessies waar die model beplan, kode skryf, toetse uitvoer en op mislukkings itereer.

Die model behaal 56.4% op SWE-Bench Pro (op van 55.6% op basis GPT-5.2) en 64.0% op Terminal-Bench 2.0 (op van 62.2%). Albei maatstawwe toets werklikewêreld-koderingstake, nie geisoleerde kodegenerasie nie.

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

MaatstafGPT-5.2-CodexGPT-5.2Claude Opus 4.6
SWE-Bench Pro56.4%55.6%
Terminal-Bench 2.064.0%62.2%#1
Konteksvenster (invoer)400K128K200K (1M beta)
Uitvoertokens128K128K128K

GPT-5.2-Codex balanseer koste en prestasie. Claude Opus 4.6 lei Terminal-Bench 2.0 en Humanity's Last Exam, terwyl GPT-5.2-Codex op prys en konteksvenstergrootte meeding.

Sleutelkenmerke vir Ontwikkelaars

Konteksverdigting

Soos Claude Opus 4.6 se verdigtingskenmerk, pers GPT-5.2-Codex vroeere konteks saam terwyl taakstatus bewaar word. Dit maak multi-uur kodeersessies moontlik waar die model die volle projek volg selfs wanneer die gesprek die konteksvenster oorskry.

Langtermyn-taakvoltooing

Die model is geoptimaliseer vir take wat baie stappe oorspan: groot herfaktorerings, kodebasismigrerings en meerleer-kenmerkimplementerings. Wanneer 'n benadering misluk, pas GPT-5.2-Codex aan en probeer weer eerder as om die taak te herbegin.

Ingeboude Kwesbaarheidsopsporing

GPT-5.2-Codex sluit kwesbaarheidsopsporing tydens kodegenerasie in. Spanne wat dieper skandering benodig, kan toegewyde gereedskap soos Claude Code Security gebruik, wat meerstap-verifikasie met vals-positief-filtrering bied.

Windows-omgewingondersteuning

OpenAI het GPT-5.2-Codex se Windows-ontwikkelingsprestasie verbeter en die Unix-gesentreerde optimalisering van vroeere modelle aangespreek.

GPT-5.2-Codex Pryse

VlakKoste per Miljoen Tokens
Invoer$1.75
Uitvoer$14.00
Gekaste Invoer$0.175 (90% afslag)

GPT-5.2-Codex is beskikbaar op alle Codex-oppervlakke vir betaalde ChatGPT-gebruikers en as 'n selfstandige API-model.

Wat GPT-5.2-Codex vir Agentiese Kodering Beteken

Die vrystelling weerspieel 'n bedryfswye verskuiwing van kodevoltooiing na volgehoue koderingsagente. OpenAI se Codex, Anthropic se Claude Code en GitHub Agentic Workflows teiken almal meerstap-ingenieurstake met minimale menslike ingryping.

Gereelde Vrae

Wat is GPT-5.2-Codex?
GPT-5.2-Codex is OpenAI se kodering-geoptimaliseerde variant van die GPT-5.2-model, vrygestel op 14 Januarie 2026. Dit is spesifiek gebou vir agentiese koderingswerkvloei waar die model volgehoue, meerstap-sagteware-ingenieurswese-sessies uitvoer. Dit behaal 56.4% op SWE-Bench Pro en 64.0% op Terminal-Bench 2.0. Die model ondersteun 'n 400K-invoer- en 128K-uitvoer-konteksvenster.
Hoeveel kos GPT-5.2-Codex?
GPT-5.2-Codex kos $1.75 per miljoen invoertokens en $14 per miljoen uitvoertokens. Gekas invoere ontvang 'n 90%-afslag, wat die effektiewe gekaste tarief na $0.175 per miljoen tokens bring. Dit maak dit aansienlik goedkoper as Claude Opus 4.6 teen $5/$25 per miljoen tokens, hoewel die twee modelle verskil in maatstafprestasie en kenmerksette.
Wat is konteksverdigting in GPT-5.2-Codex?
Konteksverdigting is 'n kenmerk wat vroeere gesprekskonteks saampers terwyl kritieke taakstatus bewaar word. Dit stel GPT-5.2-Codex in staat om multi-uur kodeersessies vol te hou sonder om die projekomvang te verloor. Wanneer 'n sessie die konteksvenstergrens nader, som die model ouer konteks op eerder as om dit te laat val.
Hoe vergelyk GPT-5.2-Codex met Claude Opus 4.6?
Op Terminal-Bench 2.0 hou Claude Opus 4.6 die toptellings, voor GPT-5.2-Codex se 64.0%. Op SWE-Bench Pro behaal GPT-5.2-Codex 56.4%. Die twee modelle neem verskillende benaderings: GPT-5.2-Codex bied 'n groter invoerkonteks (400K tokens vs. Claude se 200K standaard) en laer pryse, terwyl Claude Opus 4.6 agentspanne en hoer maatstaftellings op redeneringstake bied.

Bly op hoogte

Kry die nuutste KI-nuus in jou inkassie.

Deel