Code Velocity
Tekoälymallit

GPT-5.2-Codex: OpenAI:n agenttinen koodausmalli

·6 min lukuaika·OpenAI·Alkuperäinen lähde
Jaa
GPT-5.2-Codex-suorituskykytestikaavio, jossa näkyvät SWE-Bench Pro- ja Terminal-Bench 2.0 -tulokset verrattuna GPT-5.2-perusmalliin

GPT-5.2-Codex-suorituskykytulokset

OpenAI julkaisi GPT-5.2-Codexin 14. tammikuuta 2026, viisi viikkoa GPT-5.2-perusmallin jälkeen. Se on suunnattu agenttiseen koodaukseen: monivaiheisiin sessioihin, joissa malli suunnittelee, kirjoittaa koodia, ajaa testejä ja iteroi virheiden perusteella.

Malli saa 56,4 % SWE-Bench Pro:ssa (verrattuna GPT-5.2-perusmallin 55,6 %:iin) ja 64,0 % Terminal-Bench 2.0:ssa (verrattuna 62,2 %:iin). Molemmat suorituskykytestit mittaavat todellisia koodaustehtäviä, eivät yksittäisiä koodintuottamistehtäviä.

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

SuorituskykytestiGPT-5.2-CodexGPT-5.2Claude Opus 4.6
SWE-Bench Pro56,4 %55,6 %
Terminal-Bench 2.064,0 %62,2 %#1
Konteksti-ikkuna (syöte)400K128K200K (1M beta)
Tulostetokenit128K128K128K

GPT-5.2-Codex tasapainottaa kustannuksia ja suorituskykyä. Claude Opus 4.6 johtaa Terminal-Bench 2.0:ssa ja Humanity's Last Exam:issa, kun taas GPT-5.2-Codex kilpailee hinnalla ja konteksti-ikkunan koolla.

Keskeiset ominaisuudet kehittäjille

Kontekstin tiivistäminen

Kuten Claude Opus 4.6:n tiivistämisominaisuus, GPT-5.2-Codex pakkaa aiemman kontekstin säilyttäen tehtävätilan. Tämä mahdollistaa tuntien mittaiset koodaussessiot, joissa malli seuraa koko projektia, vaikka keskustelu ylittäisi konteksti-ikkunan.

Pitkäkestoisten tehtävien suorittaminen

Malli on optimoitu monivaiheisille tehtäville: laajoille refaktoroinneille, koodikantojen migraatioille ja monitiedostoisten ominaisuuksien toteutuksille. Kun lähestymistapa epäonnistuu, GPT-5.2-Codex mukautuu ja yrittää uudelleen tehtävän uudelleenkäynnistämisen sijaan.

Sisäänrakennettu haavoittuvuuksien tunnistus

GPT-5.2-Codex sisältää haavoittuvuuksien tunnistuksen koodin generoinnin aikana. Syvempää skannausta tarvitsevat tiimit voivat käyttää erikoistyökaluja kuten Claude Code Security, joka tarjoaa monivaiheisen todentamisen väärien positiivisten suodatuksella.

Windows-ympäristön tuki

OpenAI paransi GPT-5.2-Codexin Windows-kehityssuorituskykyä, korjaten aiempien mallien Unix-keskeistä optimointia.

GPT-5.2-Codex-hinnoittelu

TasoHinta per miljoona tokenia
Syöte$1,75
Tuloste$14,00
Välimuistitettu syöte$0,175 (90 %:n alennus)

GPT-5.2-Codex on saatavilla kaikissa Codex-ympäristöissä maksullisille ChatGPT-käyttäjille sekä erillisenä API-mallina.

Mitä GPT-5.2-Codex merkitsee agenttiselle koodaukselle

Julkaisu heijastaa koko alan siirtymää koodin täydennyksestä pitkäkestoisiin koodausagentteihin. OpenAI:n Codex, Anthropicin Claude Code ja GitHub Agentic Workflows kohdistuvat kaikki monivaiheisiin ohjelmistotehtäviin minimaalisella ihmisen väliintulolla.

Usein kysytyt kysymykset

Mikä on GPT-5.2-Codex?
GPT-5.2-Codex on OpenAI:n koodaukseen optimoitu versio GPT-5.2-mallista, julkaistu 14. tammikuuta 2026. Se on suunniteltu erityisesti agenttisiin koodaustyöprosesseihin, joissa malli suorittaa pitkäkestoisia, monivaiheisia ohjelmistokehityssessioita. Se saa 56,4 % SWE-Bench Pro:ssa ja 64,0 % Terminal-Bench 2.0:ssa, parantaen GPT-5.2-perusmallin 55,6 %:n ja 62,2 %:n tuloksia. Malli tukee 400K syöte- ja 128K tulostekonteksti-ikkunaa.
Paljonko GPT-5.2-Codex maksaa?
GPT-5.2-Codex maksaa $1,75 per miljoona syötetokenia ja $14 per miljoona tulostetokenia. Välimuistiin tallennetut syötteet saavat 90 %:n alennuksen, jolloin efektiivinen hinta on $0,175 per miljoona tokenia. Tämä tekee siitä huomattavasti edullisemman kuin Claude Opus 4.6, jonka hinta on $5/$25 per miljoona tokenia, vaikka mallit eroavat suorituskykytuloksiltaan ja ominaisuuksiltaan.
Mikä on kontekstin tiivistäminen GPT-5.2-Codexissa?
Kontekstin tiivistäminen on ominaisuus, joka pakkaa aiemman keskustelukontekstin säilyttäen samalla kriittisen tehtävätilan. Tämä mahdollistaa GPT-5.2-Codexille tuntien mittaiset koodaussessiot ilman projektin laajuuden unohtamista. Kun sessio lähestyy konteksti-ikkunan rajaa, malli tiivistää vanhemman kontekstin pudottamisen sijaan, mikä mahdollistaa pidemmät ja monimutkaisemmat koodaustehtävät ilman uudelleenkäynnistystä.
Miten GPT-5.2-Codex vertautuu Claude Opus 4.6:een?
Terminal-Bench 2.0:ssa Claude Opus 4.6 pitää kärkisijaa, edellä GPT-5.2-Codexin 64,0 %:a. SWE-Bench Pro:ssa GPT-5.2-Codex saa 56,4 %. Mallit käyttävät eri lähestymistapoja: GPT-5.2-Codex tarjoaa laajemman syötekontekstin (400K tokenia vs. Clauden 200K vakio) ja edullisemman hinnoittelun, kun taas Claude Opus 4.6 tarjoaa agenttitiimejä ja korkeampia suorituskykytuloksia päättelytehtävissä kuten Humanity's Last Exam.

Pysy ajan tasalla

Saa uusimmat tekoälyuutiset sähköpostiisi.

Jaa