GPT-5.2-Codex: Az OpenAI agens kódoló modellje

GPT-5.2-Codex benchmark eredmények

Az OpenAI 2026. január 14-én adta ki a GPT-5.2-Codex-et, öt héttel az alap GPT-5.2 modell után. Az agens kódolást célozza meg: többlépéses munkameneteket, ahol a modell tervez, kódot ír, teszteket futtat és iterál a hibákon.

A modell 56,4%-ot ért el a SWE-Bench Pro-n (az alap GPT-5.2 55,6%-áról) és 64,0%-ot a Terminal-Bench 2.0-n (62,2%-ról). Mindkét benchmark valós kódolási feladatokat tesztel, nem izolált kódgenerálást.

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

Benchmark	GPT-5.2-Codex	GPT-5.2	Claude Opus 4.6
SWE-Bench Pro	56,4%	55,6%	—
Terminal-Bench 2.0	64,0%	62,2%	#1
Kontextusablak (bemenet)	400K	128K	200K (1M beta)
Kimeneti tokenek	128K	128K	128K

A GPT-5.2-Codex egyensúlyt teremt költség és teljesítmény között. A Claude Opus 4.6 vezet a Terminal-Bench 2.0-n és a Humanity's Last Exam-on, míg a GPT-5.2-Codex áron és kontextusablak méretben versenyez.

Kulcsfontosságú funkciók fejlesztőknek

Kontextus tömörítés

A Claude Opus 4.6 tömörítési funkciójához hasonlóan a GPT-5.2-Codex összenyomja a korábbi kontextust, miközben megőrzi a feladatállapotot. Ez lehetővé teszi a többórás kódolási munkameneteket, ahol a modell nyomon követi a teljes projektet, még akkor is, ha a beszélgetés meghaladja a kontextusablakot.

Hosszú távú feladatok végrehajtása

A modell sok lépésből álló feladatokra van optimalizálva: nagy refaktorálások, kódbázis-migrációk és több fájlra kiterjedő funkció-implementációk. Ha egy megközelítés sikertelen, a GPT-5.2-Codex módosít és újrapróbálkozik ahelyett, hogy újraindítaná a feladatot.

Beépített sebezhetőség-felismerés

A GPT-5.2-Codex beépített sebezhetőség-felismerést tartalmaz a kódgenerálás során. A mélyebb vizsgálatot igénylő csapatok használhatják a dedikált eszközöket, mint a Claude Code Security, amely többlépéses ellenőrzést kínál hamis pozitív szűréssel.

Windows környezet támogatás

Az OpenAI javította a GPT-5.2-Codex Windows fejlesztési teljesítményét, kezelve a korábbi modellek Unix-centrikus optimalizálását.

GPT-5.2-Codex árazás

Szint	Költség millió tokenenként
Bemenet	$1,75
Kimenet	$14,00
Gyorsítótárazott bemenet	$0,175 (90%-os kedvezmény)

A GPT-5.2-Codex elérhető minden Codex felületen fizetős ChatGPT felhasználók számára, valamint önálló API modellként.

Mit jelent a GPT-5.2-Codex az agens kódolás számára

A kiadás egy iparági szintű váltást tükröz a kódkiegészítéstől a tartós kódoló ágensek felé. Az OpenAI Codex, az Anthropic Claude Code és a GitHub Agentic Workflows egyaránt többlépéses mérnöki feladatokat céloznak minimális emberi beavatkozással.

Gyakran ismételt kérdések

Mi az a GPT-5.2-Codex?

A GPT-5.2-Codex az OpenAI kódolásra optimalizált változata a GPT-5.2 modellnek, amely 2026. január 14-én jelent meg. Kifejezetten agens kódolási munkafolyamatokra készült, ahol a modell tartós, többlépéses szoftverfejlesztési munkameneteket futtat. 56,4%-ot ért el a SWE-Bench Pro-n és 64,0%-ot a Terminal-Bench 2.0-n, javítva az alap GPT-5.2 modell 55,6%-os és 62,2%-os eredményét. A modell 400K bemeneti és 128K kimeneti kontextusablakot támogat.

Mennyibe kerül a GPT-5.2-Codex?

A GPT-5.2-Codex ára $1,75 millió bemeneti tokenenként és $14 millió kimeneti tokenenként. A gyorsítótárazott bemenetek 90%-os kedvezményt kapnak, így az effektív gyorsítótárazott ár $0,175 millió tokenenként. Ez jelentősen olcsóbb a Claude Opus 4.6 $5/$25-ös áránál, bár a két modell benchmark teljesítménye és funkciókészlete eltér.

Mi az a kontextus tömörítés a GPT-5.2-Codex-ben?

A kontextus tömörítés egy olyan funkció, amely összenyomja a korábbi beszélgetési kontextust, miközben megőrzi a kritikus feladatállapotot. Ez lehetővé teszi a GPT-5.2-Codex számára, hogy többórás kódolási munkameneteket tartson fenn a projekt hatókörének elvesztése nélkül. Amikor egy munkamenet megközelíti a kontextusablak határát, a modell összefoglalja a régebbi kontextust ahelyett, hogy eldobná, így hosszabb és összetettebb kódolási feladatok végezhetők újraindítás nélkül.

Hogyan viszonyul a GPT-5.2-Codex a Claude Opus 4.6-hoz?

A Terminal-Bench 2.0-n a Claude Opus 4.6 tartja a legmagasabb pontszámot, megelőzve a GPT-5.2-Codex 64,0%-át. A SWE-Bench Pro-n a GPT-5.2-Codex 56,4%-ot ér el. A két modell eltérő megközelítést alkalmaz: a GPT-5.2-Codex nagyobb bemeneti kontextust (400K token vs. Claude 200K standard) és alacsonyabb árazást kínál, míg a Claude Opus 4.6 agens csapatokat és magasabb benchmark pontszámokat kínál gondolkodási feladatokon, mint a Humanity's Last Exam.