Code Velocity
AI modely

GPT-5.2-Codex: Agentický kódovací model od OpenAI

·6 min čtení·OpenAI·Původní zdroj
Sdílet
Graf benchmarků GPT-5.2-Codex zobrazující výsledky SWE-Bench Pro a Terminal-Bench 2.0 ve srovnání se základním modelem GPT-5.2

Výsledky benchmarků GPT-5.2-Codex

OpenAI vydalo GPT-5.2-Codex 14. ledna 2026, pět týdnů po základním modelu GPT-5.2. Cílí na agentické kódování: vícekrokové relace, kde model plánuje, píše kód, spouští testy a iteruje na chybách.

Model dosahuje 56,4 % na SWE-Bench Pro (oproti 55,6 % základního GPT-5.2) a 64,0 % na Terminal-Bench 2.0 (oproti 62,2 %). Oba benchmarky testují reálné kódovací úlohy, nikoli izolované generování kódu.

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

BenchmarkGPT-5.2-CodexGPT-5.2Claude Opus 4.6
SWE-Bench Pro56,4 %55,6 %
Terminal-Bench 2.064,0 %62,2 %#1
Kontextové okno (vstup)400K128K200K (1M beta)
Výstupní tokeny128K128K128K

GPT-5.2-Codex vyvažuje náklady a výkon. Claude Opus 4.6 vede Terminal-Bench 2.0 a Humanity's Last Exam, zatímco GPT-5.2-Codex konkuruje cenou a velikostí kontextového okna.

Klíčové funkce pro vývojáře

Context Compaction

Podobně jako funkce compaction u Claude Opus 4.6 komprimuje GPT-5.2-Codex dřívější kontext při zachování stavu úlohy. To umožňuje vícehodinové kódovací relace, kde model sleduje celý projekt i když konverzace překročí kontextové okno.

Dokončování dlouhodobých úloh

Model je optimalizován pro úlohy zahrnující mnoho kroků: velké refaktoringy, migrace kódových bází a implementace funkcí napříč více soubory. Když přístup selže, GPT-5.2-Codex se přizpůsobí a zkusí to znovu místo restartování úlohy.

Vestavěná detekce zranitelností

GPT-5.2-Codex zahrnuje detekci zranitelností během generování kódu. Týmy potřebující hlubší skenování mohou použít specializované nástroje jako Claude Code Security, který nabízí vícestupňovou verifikaci s filtrováním falešně pozitivních výsledků.

Podpora prostředí Windows

OpenAI vylepšilo výkon GPT-5.2-Codex v prostředí Windows, čímž řeší unixově orientovanou optimalizaci dřívějších modelů.

Ceny GPT-5.2-Codex

ÚroveňCena za milion tokenů
Vstup$1,75
Výstup$14,00
Cachovaný vstup$0,175 (90% sleva)

GPT-5.2-Codex je dostupný přes všechny platformy Codex pro placené uživatele ChatGPT a jako samostatný API model.

Co GPT-5.2-Codex znamená pro agentické kódování

Vydání odráží celoprůmyslový posun od doplňování kódu k nepřetržitým kódovacím agentům. Codex od OpenAI, Claude Code od Anthropic a GitHub Agentic Workflows cílí na vícekrokové inženýrské úlohy s minimálním lidským zásahem.

Často kladené dotazy

Co je GPT-5.2-Codex?
GPT-5.2-Codex je varianta modelu GPT-5.2 od OpenAI optimalizovaná pro kódování, vydaná 14. ledna 2026. Je speciálně navržena pro agentické kódovací pracovní postupy, kde model provádí nepřetržité, vícekrokové relace softwarového inženýrství. Dosahuje 56,4 % na SWE-Bench Pro a 64,0 % na Terminal-Bench 2.0, což je zlepšení oproti základnímu GPT-5.2 s 55,6 % a 62,2 %. Model podporuje kontextové okno 400K vstupních a 128K výstupních tokenů.
Kolik stojí GPT-5.2-Codex?
GPT-5.2-Codex stojí $1,75 za milion vstupních tokenů a $14 za milion výstupních tokenů. Cachované vstupy získávají 90% slevu, což snižuje efektivní cenu na $0,175 za milion tokenů. To jej činí výrazně levnějším než Claude Opus 4.6 za $5/$25 za milion tokenů, i když se oba modely liší ve výsledcích benchmarků a sadách funkcí.
Co je context compaction v GPT-5.2-Codex?
Context compaction je funkce, která komprimuje dřívější kontext konverzace při zachování kritického stavu úlohy. To umožňuje GPT-5.2-Codex udržovat vícehodinové kódovací relace bez ztráty přehledu o rozsahu projektu. Když se relace přiblíží limitu kontextového okna, model shrne starší kontext místo jeho zahození, což umožňuje delší a složitější kódovací úlohy bez restartování.
Jak si GPT-5.2-Codex stojí ve srovnání s Claude Opus 4.6?
Na Terminal-Bench 2.0 drží Claude Opus 4.6 nejvyšší skóre, před GPT-5.2-Codex s 64,0 %. Na SWE-Bench Pro dosahuje GPT-5.2-Codex 56,4 %. Oba modely volí odlišný přístup: GPT-5.2-Codex nabízí větší vstupní kontext (400K tokenů oproti Claudeovým 200K standardně) a nižší cenu, zatímco Claude Opus 4.6 nabízí agent teams a vyšší benchmarkové výsledky v úlohách uvažování jako Humanity's Last Exam.

Buďte v obraze

Dostávejte nejnovější AI zprávy do schránky.

Sdílet