Code Velocity
DI modeliai

GPT-5.2-Codex: OpenAI agentinis kodavimo modelis

·6 min skaitymo·OpenAI·Originalus šaltinis
Dalintis
GPT-5.2-Codex etalonų diagrama, rodanti SWE-Bench Pro ir Terminal-Bench 2.0 balus, lyginant su baziniu GPT-5.2 modeliu

GPT-5.2-Codex etalonų rezultatai

OpenAI išleido GPT-5.2-Codex 2026 m. sausio 14 d., penkias savaites po bazinio GPT-5.2 modelio. Jis skirtas agentiniam kodavimui: daugiažingsnėms sesijoms, kuriose modelis planuoja, rašo kodą, vykdo testus ir iteruoja nesėkmes.

Modelis pasiekia 56,4 % SWE-Bench Pro (padidėjimas nuo bazinio GPT-5.2 55,6 %) ir 64,0 % Terminal-Bench 2.0 (padidėjimas nuo 62,2 %). Abu etalonai tikrina realaus pasaulio kodavimo užduotis, o ne izoliuotą kodo generavimą.

GPT-5.2-Codex prieš GPT-5.2 prieš Claude Opus 4.6

EtalonasGPT-5.2-CodexGPT-5.2Claude Opus 4.6
SWE-Bench Pro56,4 %55,6 %
Terminal-Bench 2.064,0 %62,2 %#1
Konteksto langas (įvestis)400K128K200K (1M beta)
Išvesties tokenai128K128K128K

GPT-5.2-Codex subalansuoja kainą ir našumą. Claude Opus 4.6 pirmauja Terminal-Bench 2.0 ir Humanity's Last Exam, o GPT-5.2-Codex konkuruoja kaina ir konteksto lango dydžiu.

Pagrindinės funkcijos kūrėjams

Konteksto suspaudimas

Kaip ir Claude Opus 4.6 suspaudimo funkcija, GPT-5.2-Codex suglaudina ankstesnį kontekstą, išsaugodamas užduoties būseną. Tai įgalina daugiavalandžias kodavimo sesijas, kuriose modelis seka visą projektą net kai pokalbis viršija konteksto langą.

Ilgalaikių užduočių užbaigimas

Modelis optimizuotas užduotims, apimančioms daug žingsnių: dideliems pertvarkantiesiems pakeitimams, kodo bazių migracijoms ir daugiafailėms funkcijų realizacijoms. Kai požiūris nepavyksta, GPT-5.2-Codex prisitaiko ir bando iš naujo, užuot iš naujo pradėjęs užduotį.

Integruotas pažeidžiamumų aptikimas

GPT-5.2-Codex apima pažeidžiamumų aptikimą kodo generavimo metu. Komandos, kurioms reikia gilesnio skenavimo, gali naudoti specializuotus įrankius, tokius kaip Claude Code Security, kuris siūlo daugiapakopę verifikaciją su klaidingų teigiamų rezultatų filtravimu.

„Windows" aplinkos palaikymas

OpenAI pagerino GPT-5.2-Codex „Windows" kūrimo našumą, spręsdama ankstesnių modelių „Unix" orientuotą optimizavimą.

GPT-5.2-Codex kainos

LygisKaina už milijoną tokenų
Įvestis$1,75
Išvestis$14,00
Talpykloje saugoma įvestis$0,175 (90 % nuolaida)

GPT-5.2-Codex prieinamas visuose Codex paviršiuose mokamų ChatGPT vartotojų ir kaip atskiras API modelis.

Ką GPT-5.2-Codex reiškia agentiniam kodavimui

Šis išleidimas atspindi visos pramonės pokytį nuo kodo užbaigimo prie nuolatinių kodavimo agentų. OpenAI Codex, Anthropic Claude Code ir GitHub Agentic Workflows – visi skirti daugiažingsnėms inžinerinėms užduotims su minimaliu žmogaus įsikišimu.

Dažniausiai užduodami klausimai

Kas yra GPT-5.2-Codex?
GPT-5.2-Codex yra OpenAI kodavimui optimizuota GPT-5.2 modelio versija, išleista 2026 m. sausio 14 d. Ji sukurta specialiai agentinio kodavimo darbo eigoms, kuriose modelis vykdo ilgalaikes, daugiažingsnes programinės įrangos inžinerijos sesijas. Modelis pasiekia 56,4 % SWE-Bench Pro ir 64,0 % Terminal-Bench 2.0 – tai pagerėjimas lyginant su bazinio GPT-5.2 modelio 55,6 % ir 62,2 %. Modelis palaiko 400K įvesties ir 128K išvesties tokenų konteksto langą.
Kiek kainuoja GPT-5.2-Codex?
GPT-5.2-Codex kainuoja $1,75 už milijoną įvesties tokenų ir $14 už milijoną išvesties tokenų. Talpykloje saugomi įvesties duomenys gauna 90 % nuolaidą, sumažinant efektyvų tarifą iki $0,175 už milijoną tokenų. Tai gerokai pigiau nei Claude Opus 4.6 – $5/$25 už milijoną tokenų, nors abu modeliai skiriasi etalonų rezultatais ir funkcijų rinkiniais.
Kas yra konteksto suspaudimas GPT-5.2-Codex?
Konteksto suspaudimas yra funkcija, kuri suglaudina ankstesnį pokalbio kontekstą, išsaugodama kritinę užduoties būseną. Tai leidžia GPT-5.2-Codex palaikyti daugiavalandžias kodavimo sesijas neprarandant projekto apimties. Kai sesija artėja prie konteksto lango ribos, modelis apibendrina senesnį kontekstą užuot jį atmetęs, taip įgalindamas ilgesnes ir sudėtingesnes kodavimo užduotis be paleidimo iš naujo.
Kaip GPT-5.2-Codex lyginamas su Claude Opus 4.6?
Terminal-Bench 2.0 etalone Claude Opus 4.6 turi aukščiausią balą, lenkdamas GPT-5.2-Codex su 64,0 %. SWE-Bench Pro etalone GPT-5.2-Codex pasiekia 56,4 %. Abu modeliai taiko skirtingus požiūrius: GPT-5.2-Codex siūlo didesnį įvesties kontekstą (400K tokenų prieš Claude 200K standartinį) ir žemesnę kainą, o Claude Opus 4.6 siūlo agentų komandas ir aukštesnius etalonų balus samprotavimo užduotyse, tokiose kaip Humanity's Last Exam.

Būkite informuoti

Gaukite naujausias AI naujienas el. paštu.

Dalintis