Code Velocity
MI modellek

GPT-5.2-Codex: Az OpenAI agens kódoló modellje

·6 perc olvasás·OpenAI·Eredeti forrás
Megosztás
GPT-5.2-Codex benchmark diagram a SWE-Bench Pro és Terminal-Bench 2.0 eredményekkel az alap GPT-5.2 modellhez képest

GPT-5.2-Codex benchmark eredmények

Az OpenAI 2026. január 14-én adta ki a GPT-5.2-Codex-et, öt héttel az alap GPT-5.2 modell után. Az agens kódolást célozza meg: többlépéses munkameneteket, ahol a modell tervez, kódot ír, teszteket futtat és iterál a hibákon.

A modell 56,4%-ot ért el a SWE-Bench Pro-n (az alap GPT-5.2 55,6%-áról) és 64,0%-ot a Terminal-Bench 2.0-n (62,2%-ról). Mindkét benchmark valós kódolási feladatokat tesztel, nem izolált kódgenerálást.

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

BenchmarkGPT-5.2-CodexGPT-5.2Claude Opus 4.6
SWE-Bench Pro56,4%55,6%
Terminal-Bench 2.064,0%62,2%#1
Kontextusablak (bemenet)400K128K200K (1M beta)
Kimeneti tokenek128K128K128K

A GPT-5.2-Codex egyensúlyt teremt költség és teljesítmény között. A Claude Opus 4.6 vezet a Terminal-Bench 2.0-n és a Humanity's Last Exam-on, míg a GPT-5.2-Codex áron és kontextusablak méretben versenyez.

Kulcsfontosságú funkciók fejlesztőknek

Kontextus tömörítés

A Claude Opus 4.6 tömörítési funkciójához hasonlóan a GPT-5.2-Codex összenyomja a korábbi kontextust, miközben megőrzi a feladatállapotot. Ez lehetővé teszi a többórás kódolási munkameneteket, ahol a modell nyomon követi a teljes projektet, még akkor is, ha a beszélgetés meghaladja a kontextusablakot.

Hosszú távú feladatok végrehajtása

A modell sok lépésből álló feladatokra van optimalizálva: nagy refaktorálások, kódbázis-migrációk és több fájlra kiterjedő funkció-implementációk. Ha egy megközelítés sikertelen, a GPT-5.2-Codex módosít és újrapróbálkozik ahelyett, hogy újraindítaná a feladatot.

Beépített sebezhetőség-felismerés

A GPT-5.2-Codex beépített sebezhetőség-felismerést tartalmaz a kódgenerálás során. A mélyebb vizsgálatot igénylő csapatok használhatják a dedikált eszközöket, mint a Claude Code Security, amely többlépéses ellenőrzést kínál hamis pozitív szűréssel.

Windows környezet támogatás

Az OpenAI javította a GPT-5.2-Codex Windows fejlesztési teljesítményét, kezelve a korábbi modellek Unix-centrikus optimalizálását.

GPT-5.2-Codex árazás

SzintKöltség millió tokenenként
Bemenet$1,75
Kimenet$14,00
Gyorsítótárazott bemenet$0,175 (90%-os kedvezmény)

A GPT-5.2-Codex elérhető minden Codex felületen fizetős ChatGPT felhasználók számára, valamint önálló API modellként.

Mit jelent a GPT-5.2-Codex az agens kódolás számára

A kiadás egy iparági szintű váltást tükröz a kódkiegészítéstől a tartós kódoló ágensek felé. Az OpenAI Codex, az Anthropic Claude Code és a GitHub Agentic Workflows egyaránt többlépéses mérnöki feladatokat céloznak minimális emberi beavatkozással.

Gyakran ismételt kérdések

Mi az a GPT-5.2-Codex?
A GPT-5.2-Codex az OpenAI kódolásra optimalizált változata a GPT-5.2 modellnek, amely 2026. január 14-én jelent meg. Kifejezetten agens kódolási munkafolyamatokra készült, ahol a modell tartós, többlépéses szoftverfejlesztési munkameneteket futtat. 56,4%-ot ért el a SWE-Bench Pro-n és 64,0%-ot a Terminal-Bench 2.0-n, javítva az alap GPT-5.2 modell 55,6%-os és 62,2%-os eredményét. A modell 400K bemeneti és 128K kimeneti kontextusablakot támogat.
Mennyibe kerül a GPT-5.2-Codex?
A GPT-5.2-Codex ára $1,75 millió bemeneti tokenenként és $14 millió kimeneti tokenenként. A gyorsítótárazott bemenetek 90%-os kedvezményt kapnak, így az effektív gyorsítótárazott ár $0,175 millió tokenenként. Ez jelentősen olcsóbb a Claude Opus 4.6 $5/$25-ös áránál, bár a két modell benchmark teljesítménye és funkciókészlete eltér.
Mi az a kontextus tömörítés a GPT-5.2-Codex-ben?
A kontextus tömörítés egy olyan funkció, amely összenyomja a korábbi beszélgetési kontextust, miközben megőrzi a kritikus feladatállapotot. Ez lehetővé teszi a GPT-5.2-Codex számára, hogy többórás kódolási munkameneteket tartson fenn a projekt hatókörének elvesztése nélkül. Amikor egy munkamenet megközelíti a kontextusablak határát, a modell összefoglalja a régebbi kontextust ahelyett, hogy eldobná, így hosszabb és összetettebb kódolási feladatok végezhetők újraindítás nélkül.
Hogyan viszonyul a GPT-5.2-Codex a Claude Opus 4.6-hoz?
A Terminal-Bench 2.0-n a Claude Opus 4.6 tartja a legmagasabb pontszámot, megelőzve a GPT-5.2-Codex 64,0%-át. A SWE-Bench Pro-n a GPT-5.2-Codex 56,4%-ot ér el. A két modell eltérő megközelítést alkalmaz: a GPT-5.2-Codex nagyobb bemeneti kontextust (400K token vs. Claude 200K standard) és alacsonyabb árazást kínál, míg a Claude Opus 4.6 agens csapatokat és magasabb benchmark pontszámokat kínál gondolkodási feladatokon, mint a Humanity's Last Exam.

Maradjon naprakész

Kapja meg a legfrissebb AI híreket e-mailben.

Megosztás