GPT-5.2-Codex: OpenAI agentne kodeerimismudel

GPT-5.2-Codex võrdlustestide tulemused

OpenAI avaldas GPT-5.2-Codexi 14. jaanuaril 2026, viis nädalat pärast GPT-5.2 baasmudelit. See on suunatud agentsele kodeerimisele: mitmeetapilistele seanssidele, kus mudel planeerib, kirjutab koodi, käivitab teste ja itereerib vigade kallal.

Mudel saavutab 56,4% SWE-Bench Pro testis (üles 55,6%-lt GPT-5.2 baasmudelil) ja 64,0% Terminal-Bench 2.0 testis (üles 62,2%-lt). Mõlemad võrdlustestid hindavad reaalseid kodeerimisülesandeid, mitte isoleeritud koodi genereerimist.

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

Võrdlustest	GPT-5.2-Codex	GPT-5.2	Claude Opus 4.6
SWE-Bench Pro	56,4%	55,6%	—
Terminal-Bench 2.0	64,0%	62,2%	#1
Kontekstiaken (sisend)	400K	128K	200K (1M beeta)
Väljundtokenid	128K	128K	128K

GPT-5.2-Codex tasakaalustab hinna ja jõudluse. Claude Opus 4.6 juhib Terminal-Bench 2.0 ja Humanity's Last Exam teste, samas kui GPT-5.2-Codex konkureerib hinna ja kontekstiakna suurusega.

Põhifunktsioonid arendajatele

Konteksti tihendamine

Sarnaselt Claude Opus 4.6 tihendamisfunktsiooniga suudab GPT-5.2-Codex tihendada varasemat konteksti, säilitades ülesande oleku. See võimaldab mitmetunniseid kodeerimisseansse, kus mudel jälgib kogu projekti isegi siis, kui vestlus ületab kontekstiakna.

Pikaajaliste ülesannete lõpetamine

Mudel on optimeeritud paljusid etappe hõlmavateks ülesanneteks: suured ümberstruktuurimised, koodibaasi migratsioonid ja mitme faili funktsioonide rakendamine. Kui lähenemine ebaõnnestub, kohandab GPT-5.2-Codex strateegiat ja proovib uuesti, selle asemel et ülesannet otsast alustada.

Sisseehitatud turvanõrkuste tuvastamine

GPT-5.2-Codex sisaldab turvanõrkuste tuvastamist koodi genereerimisel. Meeskonnad, kes vajavad põhjalikumat skaneerimist, saavad kasutada spetsiaalseid tööriistu nagu Claude Code Security, mis pakub mitmeastmelist kontrollimist valepositiivsete filtreerimisega.

Windowsi keskkonna tugi

OpenAI parandas GPT-5.2-Codexi jõudlust Windowsi arenduskeskkonnas, lahendades varasemate mudelite Unixi-kesksust.

GPT-5.2-Codexi hinnakiri

Tase	Hind miljoni tokeni kohta
Sisend	$1,75
Väljund	$14,00
Vahemällu salvestatud sisend	$0,175 (90% allahindlus)

GPT-5.2-Codex on saadaval kõigil Codexi platvormidel tasuliste ChatGPT kasutajate jaoks ja iseseisva API mudelina.

Mida GPT-5.2-Codex tähendab agentsele kodeerimisele

See avaldamine peegeldab üleüldist tööstuse nihet koodi lõpetamiselt püsivate kodeerimisagentide suunas. OpenAI Codex, Anthropicu Claude Code ja GitHub Agentic Workflows sihivad kõik mitmeetapilisi insenerülesandeid minimaalse inimsekkumisega.

Korduma kippuvad küsimused

Mis on GPT-5.2-Codex?

GPT-5.2-Codex on OpenAI kodeerimisele optimeeritud GPT-5.2 mudeli variant, mis avaldati 14. jaanuaril 2026. See on loodud spetsiaalselt agentseteks kodeerimistöövoogudeks, kus mudel teostab pikaajaliselt mitmeetapilisi tarkvaraarenduse seansse. Mudel saavutab 56,4% SWE-Bench Pro ja 64,0% Terminal-Bench 2.0 testides, parandades GPT-5.2 baasmudeli 55,6% ja 62,2% tulemusi. Mudel toetab 400K sisend- ja 128K väljundtokenite kontekstiakent.

Kui palju GPT-5.2-Codex maksab?

GPT-5.2-Codex maksab $1,75 miljoni sisendtokeni ja $14 miljoni väljundtokeni kohta. Vahemällu salvestatud sisendid saavad 90% allahindlust, mis teeb efektiivseks hinnaks $0,175 miljoni tokeni kohta. See on märkimisväärselt odavam kui Claude Opus 4.6 hinnaga $5/$25 miljoni tokeni kohta, kuigi mudelid erinevad võrdlustestide tulemuste ja funktsioonide poolest.

Mis on konteksti tihendamine GPT-5.2-Codexis?

Konteksti tihendamine on funktsioon, mis tihendab varasema vestluskonteksti, säilitades kriitilise ülesande oleku. See võimaldab GPT-5.2-Codexil jätkata mitmetunniseid kodeerimisseansse ilma projekti ulatust kaotamata. Kui seanss läheneb kontekstiakna piirile, koostab mudel varasemast kontekstist kokkuvõtte selle asemel, et seda eemaldada, võimaldades pikemaid ja keerukamaid kodeerimisülesandeid.

Kuidas GPT-5.2-Codex võrdleb Claude Opus 4.6-ga?

Terminal-Bench 2.0 testis hoiab Claude Opus 4.6 kõrgeimat tulemust, edestades GPT-5.2-Codex 64,0% tulemust. SWE-Bench Pro testis saavutab GPT-5.2-Codex 56,4%. Mudelid kasutavad erinevaid lähenemisviise: GPT-5.2-Codex pakub suuremat sisendkonteksti (400K tokenit vs Claude'i 200K standardne) ja madalamat hinda, samas kui Claude Opus 4.6 pakub agentide meeskondi ja kõrgemaid tulemusi mõtlemisülesannetes nagu Humanity's Last Exam.