Code Velocity
MI modeļi

GPT-5.2-Codex: OpenAI agenturālais kodēšanas modelis

·6 min lasīšana·OpenAI·Sākotnējais avots
Dalīties
GPT-5.2-Codex etalontesta diagramma, kas parāda SWE-Bench Pro un Terminal-Bench 2.0 rezultātus salīdzinājumā ar GPT-5.2 bāzes modeli

GPT-5.2-Codex etalontesta rezultāti

OpenAI izlaida GPT-5.2-Codex 2026. gada 14. janvārī, piecas nedēļas pēc bāzes GPT-5.2 modeļa. Tas ir paredzēts agenturālajai kodēšanai: daudzsoļu sesijām, kur modelis plāno, raksta kodu, palaiž testus un iterē kļūdu labošanā.

Modelis sasniedz 56,4% SWE-Bench Pro (no 55,6% bāzes GPT-5.2) un 64,0% Terminal-Bench 2.0 (no 62,2%). Abi etalontesti pārbauda reālus kodēšanas uzdevumus, nevis izolētu koda ģenerēšanu.

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

EtalontestsGPT-5.2-CodexGPT-5.2Claude Opus 4.6
SWE-Bench Pro56,4%55,6%
Terminal-Bench 2.064,0%62,2%#1
Konteksta logs (ievade)400K128K200K (1M beta)
Izvades tokeni128K128K128K

GPT-5.2-Codex līdzsvaro cenu un veiktspēju. Claude Opus 4.6 vada Terminal-Bench 2.0 un Humanity's Last Exam, savukārt GPT-5.2-Codex konkurē ar cenu un konteksta loga lielumu.

Galvenās funkcijas izstrādātājiem

Konteksta kompakcija

Līdzīgi Claude Opus 4.6 kompakcijas funkcijai, GPT-5.2-Codex var saspiest agrāko kontekstu, saglabājot uzdevuma stāvokli. Tas ļauj daudzstundu kodēšanas sesijas, kur modelis seko visam projektam pat tad, kad saruna pārsniedz konteksta logu.

Ilgtermiņa uzdevumu izpilde

Modelis ir optimizēts uzdevumiem, kas aptver daudzus soļus: lielas pārstrukturēšanas, kodu bāzes migrācijas un daudzfailu funkciju ieviešana. Kad pieeja neizdodas, GPT-5.2-Codex pielāgojas un mēģina vēlreiz, nevis sāk uzdevumu no jauna.

Iebūvēta ievainojamību noteikšana

GPT-5.2-Codex ietver ievainojamību noteikšanu koda ģenerēšanas laikā. Komandām, kurām nepieciešama padziļināta skenēšana, pieejami specializēti rīki kā Claude Code Security, kas piedāvā daudzpakāpju verifikāciju ar viltus pozitīvu filtrēšanu.

Windows vides atbalsts

OpenAI uzlaboja GPT-5.2-Codex veiktspēju Windows izstrādes vidē, novēršot agrāko modeļu Unix-centrisko optimizāciju.

GPT-5.2-Codex cenas

LīmenisCena par miljonu tokenu
Ievade$1,75
Izvade$14,00
Kešotā ievade$0,175 (90% atlaide)

GPT-5.2-Codex ir pieejams visās Codex platformās maksas ChatGPT lietotājiem un kā atsevišķs API modelis.

Ko GPT-5.2-Codex nozīmē agenturālajai kodēšanai

Šis izlaidums atspoguļo visas nozares pāreju no koda papildināšanas uz ilgstošiem kodēšanas aģentiem. OpenAI Codex, Anthropic Claude Code un GitHub Agentic Workflows — visi mērķē uz daudzsoļu inženierijas uzdevumiem ar minimālu cilvēka iejaukšanos.

Bieži uzdotie jautājumi

Kas ir GPT-5.2-Codex?
GPT-5.2-Codex ir OpenAI kodēšanai optimizēts GPT-5.2 modeļa variants, kas izlaists 2026. gada 14. janvārī. Tas ir īpaši veidots agenturālām kodēšanas darba plūsmām, kur modelis veic ilgstošas, daudzsoļu programmatūras izstrādes sesijas. Tas sasniedz 56,4% SWE-Bench Pro un 64,0% Terminal-Bench 2.0, uzlabojot bāzes GPT-5.2 modeļa 55,6% un 62,2% rezultātus. Modelis atbalsta 400K ievades un 128K izvades tokenu konteksta logu.
Cik maksā GPT-5.2-Codex?
GPT-5.2-Codex maksā $1,75 par miljonu ievades tokenu un $14 par miljonu izvades tokenu. Kešatiem ievades datiem ir 90% atlaide, kas efektīvo kešoto cenu samazina līdz $0,175 par miljonu tokenu. Tas ir ievērojami lētāks nekā Claude Opus 4.6 par $5/$25 par miljonu tokenu, lai gan abi modeļi atšķiras etalontestos un funkcionalitātē.
Kas ir konteksta kompakcija GPT-5.2-Codex?
Konteksta kompakcija ir funkcija, kas saspiež agrāko sarunas kontekstu, saglabājot kritisko uzdevuma stāvokli. Tas ļauj GPT-5.2-Codex uzturēt daudzstundu kodēšanas sesijas, nezaudējot projekta apjomu. Kad sesija tuvojas konteksta loga robežai, modelis apkopo vecāko kontekstu nevis to nomet, ļaujot ilgākiem un sarežģītākiem kodēšanas uzdevumiem.
Kā GPT-5.2-Codex salīdzinās ar Claude Opus 4.6?
Terminal-Bench 2.0 testā Claude Opus 4.6 tur augstāko rezultātu, apsteidzot GPT-5.2-Codex ar 64,0%. SWE-Bench Pro testā GPT-5.2-Codex sasniedz 56,4%. Abi modeļi izmanto atšķirīgas pieejas: GPT-5.2-Codex piedāvā lielāku ievades kontekstu (400K tokenu pret Claude 200K standarta) un zemāku cenu, savukārt Claude Opus 4.6 piedāvā aģentu komandas un augstākus rezultātus domāšanas uzdevumos kā Humanity's Last Exam.

Esiet informēti

Saņemiet jaunākās AI ziņas savā e-pastā.

Dalīties