GPT-5.2-Codex: OpenAI-jev agentni model za kodiranje

Rezultati meril GPT-5.2-Codex

OpenAI je 14. januarja 2026 izdal GPT-5.2-Codex, pet tednov po osnovnem modelu GPT-5.2. Namenjen je agentnemu kodiranju: večstopenjskim sejam, kjer model načrtuje, piše kodo, izvaja teste in iterira ob napakah.

Model dosega 56,4 % na SWE-Bench Pro (v primerjavi s 55,6 % osnovnega GPT-5.2) in 64,0 % na Terminal-Bench 2.0 (v primerjavi z 62,2 %). Oba merila testirata realne naloge kodiranja, ne izoliranega generiranja kode.

GPT-5.2-Codex proti GPT-5.2 proti Claude Opus 4.6

Merilo	GPT-5.2-Codex	GPT-5.2	Claude Opus 4.6
SWE-Bench Pro	56,4 %	55,6 %	—
Terminal-Bench 2.0	64,0 %	62,2 %	#1
Kontekstno okno (vhod)	400K	128K	200K (1M beta)
Izhodni žetoni	128K	128K	128K

GPT-5.2-Codex uravnoveša ceno in zmogljivost. Claude Opus 4.6 vodi na Terminal-Bench 2.0 in Humanity's Last Exam, medtem ko GPT-5.2-Codex konkurira s ceno in velikostjo kontekstnega okna.

Ključne funkcije za razvijalce

Zgoščevanje konteksta

Podobno kot funkcija zgoščevanja Claude Opus 4.6, GPT-5.2-Codex stisne prejšnji kontekst ob ohranjanju stanja naloge. To omogoča večurne seje kodiranja, kjer model sledi celotnemu projektu, tudi ko pogovor preseže kontekstno okno.

Dokončanje nalog z dolgim časovnim razponom

Model je optimiziran za naloge, ki obsegajo več korakov: obsežne refaktorizacije, migracije kodnih baz in implementacije funkcij v več datotekah. Ko pristop ne uspe, se GPT-5.2-Codex prilagodi in poskusi znova, namesto da nalogo začne od začetka.

Vgrajena zaznava ranljivosti

GPT-5.2-Codex vključuje zaznavo ranljivosti med generiranjem kode. Ekipe, ki potrebujejo temeljitejše pregledovanje, lahko uporabijo namensko orodje, kot je Claude Code Security, ki ponuja večstopenjsko preverjanje s filtriranjem lažno pozitivnih rezultatov.

Podpora za okolje Windows

OpenAI je izboljšal zmogljivost GPT-5.2-Codex v okolju Windows in odpravil usmerjenost prejšnjih modelov na Unix.

Cenik GPT-5.2-Codex

Raven	Cena na milijon žetonov
Vhod	$1,75
Izhod	$14,00
Predpomnjeni vhod	$0,175 (90-% popust)

GPT-5.2-Codex je na voljo na vseh površinah Codex za plačljive uporabnike ChatGPT in kot samostojen model API.

Kaj GPT-5.2-Codex pomeni za agentno kodiranje

Izdaja odraža preobrat celotne panoge od dokončevanja kode k trajnim agentom za kodiranje. OpenAI-jev Codex, Anthropicov Claude Code in GitHub Agentic Workflows ciljajo na večstopenjske inženirske naloge z minimalnim človeškim posredovanjem.

Pogosta vprašanja

Kaj je GPT-5.2-Codex?

GPT-5.2-Codex je OpenAI-jeva za kodiranje optimizirana različica modela GPT-5.2, izdana 14. januarja 2026. Zasnovana je posebej za agentne delovne tokove kodiranja, kjer model izvaja trajne, večstopenjske seje programskega inženirstva. Dosega 56,4 % na SWE-Bench Pro in 64,0 % na Terminal-Bench 2.0, kar je izboljšava glede na 55,6 % in 62,2 % osnovnega modela GPT-5.2. Model podpira kontekstno okno s 400K vhodnimi in 128K izhodnimi žetoni.

Koliko stane GPT-5.2-Codex?

GPT-5.2-Codex stane $1,75 na milijon vhodnih žetonov in $14 na milijon izhodnih žetonov. Predpomnjeni vnosi prejmejo 90-% popust, kar znese efektivno ceno $0,175 na milijon žetonov. To je znatno ceneje od Claude Opus 4.6 pri $5/$25 na milijon žetonov, čeprav se modela razlikujeta v merilih učinkovitosti in naboru funkcij.

Kaj je zgoščevanje konteksta v GPT-5.2-Codex?

Zgoščevanje konteksta je funkcija, ki stisne prejšnji kontekst pogovora ob ohranjanju ključnega stanja naloge. To omogoča GPT-5.2-Codex izvajanje večurnih sej kodiranja brez izgube pregleda nad obsegom projekta. Ko se seja približa meji kontekstnega okna, model starejši kontekst povzame namesto da ga zavrže, kar omogoča daljše in bolj zapletene naloge kodiranja brez ponovnega zagona.

Kako se GPT-5.2-Codex primerja s Claude Opus 4.6?

Na Terminal-Bench 2.0 Claude Opus 4.6 drži najvišji rezultat, pred GPT-5.2-Codex s 64,0 %. Na SWE-Bench Pro GPT-5.2-Codex dosega 56,4 %. Modela sledita različnima pristopoma: GPT-5.2-Codex ponuja večji vhodni kontekst (400K žetonov proti Claudovim 200K standardno) in nižjo ceno, medtem ko Claude Opus 4.6 ponuja ekipe agentov in višje rezultate na merilih sklepanja, kot je Humanity's Last Exam.