GPT-5.2-Codex: OpenAI-jev model za agentsko programiranje

Rezultati GPT-5.2-Codex na referentnim testovima

OpenAI je objavio GPT-5.2-Codex 14. siječnja 2026., pet tjedana nakon baznog modela GPT-5.2. Cilja na agentsko programiranje: višekoračne sesije u kojima model planira, piše kod, pokreće testove i iterira na greškama.

Model postiže 56.4% na SWE-Bench Pro (porast s 55.6% baznog GPT-5.2) i 64.0% na Terminal-Bench 2.0 (porast s 62.2%). Oba testa ispituju stvarne programerske zadatke, ne izolirano generiranje koda.

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

Referentni test	GPT-5.2-Codex	GPT-5.2	Claude Opus 4.6
SWE-Bench Pro	56.4%	55.6%	—
Terminal-Bench 2.0	64.0%	62.2%	#1
Kontekstualni prozor (ulaz)	400K	128K	200K (1M beta)
Izlazni tokeni	128K	128K	128K

GPT-5.2-Codex balansira cijenu i performanse. Claude Opus 4.6 vodi na Terminal-Bench 2.0 i Humanity's Last Exam, dok GPT-5.2-Codex konkurira cijenom i veličinom kontekstualnog prozora.

Ključne značajke za programere

Kompakcija konteksta

Poput značajke kompakcije Claude Opus 4.6, GPT-5.2-Codex komprimira raniji kontekst uz očuvanje stanja zadatka. To omogućuje višesatne sesije programiranja u kojima model prati cijeli projekt čak i kad razgovor prelazi kontekstualni prozor.

Dovršavanje dugoročnih zadataka

Model je optimiziran za zadatke koji obuhvaćaju mnogo koraka: velike refaktoriranja, migracije baza koda i implementacije značajki u više datoteka. Kad pristup ne uspije, GPT-5.2-Codex se prilagođava i pokušava ponovno umjesto da restartira zadatak.

Ugrađena detekcija ranjivosti

GPT-5.2-Codex uključuje detekciju ranjivosti tijekom generiranja koda. Timovi kojima je potrebno dublje skeniranje mogu koristiti namjenske alate poput Claude Code Security, koji nudi višefaznu verifikaciju s filtriranjem lažnih pozitiva.

Podrška za Windows okruženje

OpenAI je poboljšao performanse GPT-5.2-Codex za razvoj na Windowsu, rješavajući Unix-centričnu optimizaciju ranijih modela.

Cijene GPT-5.2-Codex

Razina	Cijena po milijun tokena
Ulaz	$1.75
Izlaz	$14.00
Keširani ulaz	$0.175 (90% popusta)

GPT-5.2-Codex dostupan je na svim Codex platformama za plaćene ChatGPT korisnike i kao samostalni API model.

Što GPT-5.2-Codex znači za agentsko programiranje

Objava odražava širi industrijski pomak s dovršavanja koda na održive agente za programiranje. OpenAI-jev Codex, Anthropicov Claude Code i GitHub Agentic Workflows svi ciljaju na višekoračne inženjerske zadatke s minimalnom ljudskom intervencijom.

Često postavljana pitanja

Što je GPT-5.2-Codex?

GPT-5.2-Codex je OpenAI-jeva varijanta modela GPT-5.2 optimizirana za programiranje, objavljena 14. siječnja 2026. Posebno je dizajniran za agentske radne procese u programiranju gdje model provodi višekoračne sesije softverskog inženjerstva. Postiže 56.4% na SWE-Bench Pro i 64.0% na Terminal-Bench 2.0, poboljšanje u odnosu na bazni model GPT-5.2 s 55.6% i 62.2%. Model podržava kontekstualni prozor od 400K ulaznih i 128K izlaznih tokena.

Koliko košta GPT-5.2-Codex?

GPT-5.2-Codex košta $1.75 po milijun ulaznih tokena i $14 po milijun izlaznih tokena. Keširani ulazi dobivaju 90% popusta, čime efektivna cijena pada na $0.175 po milijun tokena. To ga čini značajno jeftinijim od Claude Opus 4.6 po $5/$25 po milijun tokena, iako se dva modela razlikuju po rezultatima i značajkama.

Što je kompakcija konteksta u GPT-5.2-Codex?

Kompakcija konteksta je značajka koja komprimira raniji kontekst razgovora uz očuvanje kritičnog stanja zadatka. To omogućuje GPT-5.2-Codex održavanje višesatnih sesija programiranja bez gubljenja opsega projekta. Kad sesija dosegne granicu kontekstualnog prozora, model sažima stariji kontekst umjesto da ga odbaci, omogućujući duže i složenije zadatke bez ponovnog pokretanja.

Kako se GPT-5.2-Codex uspoređuje s Claude Opus 4.6?

Na Terminal-Bench 2.0, Claude Opus 4.6 drži vrh, ispred GPT-5.2-Codex rezultata od 64.0%. Na SWE-Bench Pro, GPT-5.2-Codex postiže 56.4%. Dva modela koriste različite pristupe: GPT-5.2-Codex nudi veći ulazni kontekst (400K tokena naspram Claudeovih 200K standardnih) i nižu cijenu, dok Claude Opus 4.6 nudi agentske timove i više rezultate na zadacima zaključivanja poput Humanity's Last Exam.