GPT-5.2-Codex: OpenAI:n agenttinen koodausmalli

GPT-5.2-Codex-suorituskykytulokset

OpenAI julkaisi GPT-5.2-Codexin 14. tammikuuta 2026, viisi viikkoa GPT-5.2-perusmallin jälkeen. Se on suunnattu agenttiseen koodaukseen: monivaiheisiin sessioihin, joissa malli suunnittelee, kirjoittaa koodia, ajaa testejä ja iteroi virheiden perusteella.

Malli saa 56,4 % SWE-Bench Pro:ssa (verrattuna GPT-5.2-perusmallin 55,6 %:iin) ja 64,0 % Terminal-Bench 2.0:ssa (verrattuna 62,2 %:iin). Molemmat suorituskykytestit mittaavat todellisia koodaustehtäviä, eivät yksittäisiä koodintuottamistehtäviä.

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

Suorituskykytesti	GPT-5.2-Codex	GPT-5.2	Claude Opus 4.6
SWE-Bench Pro	56,4 %	55,6 %	—
Terminal-Bench 2.0	64,0 %	62,2 %	#1
Konteksti-ikkuna (syöte)	400K	128K	200K (1M beta)
Tulostetokenit	128K	128K	128K

GPT-5.2-Codex tasapainottaa kustannuksia ja suorituskykyä. Claude Opus 4.6 johtaa Terminal-Bench 2.0:ssa ja Humanity's Last Exam:issa, kun taas GPT-5.2-Codex kilpailee hinnalla ja konteksti-ikkunan koolla.

Keskeiset ominaisuudet kehittäjille

Kontekstin tiivistäminen

Kuten Claude Opus 4.6:n tiivistämisominaisuus, GPT-5.2-Codex pakkaa aiemman kontekstin säilyttäen tehtävätilan. Tämä mahdollistaa tuntien mittaiset koodaussessiot, joissa malli seuraa koko projektia, vaikka keskustelu ylittäisi konteksti-ikkunan.

Pitkäkestoisten tehtävien suorittaminen

Malli on optimoitu monivaiheisille tehtäville: laajoille refaktoroinneille, koodikantojen migraatioille ja monitiedostoisten ominaisuuksien toteutuksille. Kun lähestymistapa epäonnistuu, GPT-5.2-Codex mukautuu ja yrittää uudelleen tehtävän uudelleenkäynnistämisen sijaan.

Sisäänrakennettu haavoittuvuuksien tunnistus

GPT-5.2-Codex sisältää haavoittuvuuksien tunnistuksen koodin generoinnin aikana. Syvempää skannausta tarvitsevat tiimit voivat käyttää erikoistyökaluja kuten Claude Code Security, joka tarjoaa monivaiheisen todentamisen väärien positiivisten suodatuksella.

Windows-ympäristön tuki

OpenAI paransi GPT-5.2-Codexin Windows-kehityssuorituskykyä, korjaten aiempien mallien Unix-keskeistä optimointia.

GPT-5.2-Codex-hinnoittelu

Taso	Hinta per miljoona tokenia
Syöte	$1,75
Tuloste	$14,00
Välimuistitettu syöte	$0,175 (90 %:n alennus)

GPT-5.2-Codex on saatavilla kaikissa Codex-ympäristöissä maksullisille ChatGPT-käyttäjille sekä erillisenä API-mallina.

Mitä GPT-5.2-Codex merkitsee agenttiselle koodaukselle

Julkaisu heijastaa koko alan siirtymää koodin täydennyksestä pitkäkestoisiin koodausagentteihin. OpenAI:n Codex, Anthropicin Claude Code ja GitHub Agentic Workflows kohdistuvat kaikki monivaiheisiin ohjelmistotehtäviin minimaalisella ihmisen väliintulolla.

Usein kysytyt kysymykset

Mikä on GPT-5.2-Codex?

GPT-5.2-Codex on OpenAI:n koodaukseen optimoitu versio GPT-5.2-mallista, julkaistu 14. tammikuuta 2026. Se on suunniteltu erityisesti agenttisiin koodaustyöprosesseihin, joissa malli suorittaa pitkäkestoisia, monivaiheisia ohjelmistokehityssessioita. Se saa 56,4 % SWE-Bench Pro:ssa ja 64,0 % Terminal-Bench 2.0:ssa, parantaen GPT-5.2-perusmallin 55,6 %:n ja 62,2 %:n tuloksia. Malli tukee 400K syöte- ja 128K tulostekonteksti-ikkunaa.

Paljonko GPT-5.2-Codex maksaa?

GPT-5.2-Codex maksaa $1,75 per miljoona syötetokenia ja $14 per miljoona tulostetokenia. Välimuistiin tallennetut syötteet saavat 90 %:n alennuksen, jolloin efektiivinen hinta on $0,175 per miljoona tokenia. Tämä tekee siitä huomattavasti edullisemman kuin Claude Opus 4.6, jonka hinta on $5/$25 per miljoona tokenia, vaikka mallit eroavat suorituskykytuloksiltaan ja ominaisuuksiltaan.

Mikä on kontekstin tiivistäminen GPT-5.2-Codexissa?

Kontekstin tiivistäminen on ominaisuus, joka pakkaa aiemman keskustelukontekstin säilyttäen samalla kriittisen tehtävätilan. Tämä mahdollistaa GPT-5.2-Codexille tuntien mittaiset koodaussessiot ilman projektin laajuuden unohtamista. Kun sessio lähestyy konteksti-ikkunan rajaa, malli tiivistää vanhemman kontekstin pudottamisen sijaan, mikä mahdollistaa pidemmät ja monimutkaisemmat koodaustehtävät ilman uudelleenkäynnistystä.

Miten GPT-5.2-Codex vertautuu Claude Opus 4.6:een?

Terminal-Bench 2.0:ssa Claude Opus 4.6 pitää kärkisijaa, edellä GPT-5.2-Codexin 64,0 %:a. SWE-Bench Pro:ssa GPT-5.2-Codex saa 56,4 %. Mallit käyttävät eri lähestymistapoja: GPT-5.2-Codex tarjoaa laajemman syötekontekstin (400K tokenia vs. Clauden 200K vakio) ja edullisemman hinnoittelun, kun taas Claude Opus 4.6 tarjoaa agenttitiimejä ja korkeampia suorituskykytuloksia päättelytehtävissä kuten Humanity's Last Exam.