Code Velocity
Gervigreindar líkön

GPT-5.2-Codex: Agentískt forritunarlíkan OpenAI

·6 mín lestur·OpenAI·Upprunaleg heimild
Deila
GPT-5.2-Codex viðmiðagraf sem sýnir SWE-Bench Pro og Terminal-Bench 2.0 skor í samanburði við GPT-5.2 grunnlíkan

GPT-5.2-Codex Viðmiðaniðurstöður

OpenAI gaf út GPT-5.2-Codex þann 14. janúar 2026, fimm vikum eftir grunn GPT-5.2 líkanið. Það miðar á agentíska forritun: fjölþrepa lotur þar sem líkanið skipuleggur, skrifar kóða, keyrir prófanir og endurtekur við mistök.

Líkanið skorar 56.4% á SWE-Bench Pro (upp úr 55.6% á grunn GPT-5.2) og 64.0% á Terminal-Bench 2.0 (upp úr 62.2%). Bæði viðmiðin prófa raunveruleg forritunarverkefni, ekki einangraða kóðaframleiðslu.

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

ViðmiðGPT-5.2-CodexGPT-5.2Claude Opus 4.6
SWE-Bench Pro56.4%55.6%
Terminal-Bench 2.064.0%62.2%#1
Samhengisgluggi (inntak)400K128K200K (1M beta)
Úttakstókar128K128K128K

GPT-5.2-Codex jafnar jafnvægi milli kostnaðar og frammistöðu. Claude Opus 4.6 leiðir Terminal-Bench 2.0 og Humanity's Last Exam, á meðan GPT-5.2-Codex keppir á verði og stærð samhengisglugga.

Helstu Eiginleikar fyrir Forritara

Samþjöppun Samhengis

Líkt og Claude Opus 4.6 samþjöppunareiginleiki, þjappar GPT-5.2-Codex eldra samhengi á meðan verkefnisástandi er viðhaldið. Þetta gerir kleift margra klukkustunda forritunarlotur þar sem líkanið fylgist með öllu verkefninu jafnvel þótt samtalið fari yfir samhengisgluggann.

Langtímaverkefnaklárari

Líkanið er bestilltur fyrir verkefni sem spanna mörg skref: stórar endurskipulagningar, kóðagrunnsflutningar og fjölskráar eiginleikautfærslur. Þegar nálgun mistekst, aðlagar GPT-5.2-Codex og reynir aftur í stað þess að byrja verkefnið upp á nýtt.

Innbyggð Veikleikafinding

GPT-5.2-Codex inniheldur veikleikafindingu meðan á kóðaframleiðslu stendur. Teymi sem þurfa dýpri skönnun geta notað sérhæfð verkfæri eins og Claude Code Security, sem býður fjölþrepa sannprófun með falskt-jákvæðri síun.

Windows Umhverfisstuðningur

OpenAI bætti Windows þróunarframmistöðu GPT-5.2-Codex, og leysti Unix-miðaða bestillingu eldri líkana.

GPT-5.2-Codex Verðlagning

StigKostnaður á Milljón Tókana
Inntak$1.75
Úttak$14.00
Skyndiminni-Inntak$0.175 (90% afsláttur)

GPT-5.2-Codex er aðgengilegt á öllum Codex flötum fyrir greidda ChatGPT notendur og sem sjálfstætt API líkan.

Hvað GPT-5.2-Codex Þýðir fyrir Agentíska Forritun

Útgáfan endurspeglar breytingu í greininni frá kóðaklárari yfir í viðvarandi forritunaragenta. Codex frá OpenAI, Claude Code frá Anthropic og GitHub Agentic Workflows miða öll á fjölþrepa verkfræðiverkefni með lágmarks mannlegri íhlutun.

Algengar spurningar

Hvað er GPT-5.2-Codex?
GPT-5.2-Codex er forritunarbestillt afbrigði OpenAI af GPT-5.2 líkaninu, gefið út 14. janúar 2026. Það er sérstaklega byggt fyrir agentísk forritunarflæði þar sem líkanið keyrir viðvarandi, fjölþrepa hugbúnaðarverkfræðilotur. Það skorar 56.4% á SWE-Bench Pro og 64.0% á Terminal-Bench 2.0. Líkanið styður 400K inntak og 128K úttak samhengisglugga.
Hvað kostar GPT-5.2-Codex?
GPT-5.2-Codex kostar $1.75 á milljón inntakstókana og $14 á milljón úttakstókana. Skyndiminni-inntak fær 90% afslátt, sem gerir virkt skyndiminniverð $0.175 á milljón tókana. Þetta gerir það verulega ódýrara en Claude Opus 4.6 á $5/$25 á milljón tókana, þótt líkönin tvö séu ólík í viðmiðaframmistöðu og eiginleikum.
Hvað er samþjöppun samhengis í GPT-5.2-Codex?
Samþjöppun samhengis er eiginleiki sem þjappar eldra samhengi samtals á meðan mikilvægu verkefnisástandi er viðhaldið. Þetta gerir GPT-5.2-Codex kleift að viðhalda margra klukkustunda forritunarlotur án þess að missa yfirsýn yfir verkefnið. Þegar lota nálgast samhengisgluggamörk, dregur líkanið saman eldra samhengi í stað þess að henda því.
Hvernig ber GPT-5.2-Codex saman við Claude Opus 4.6?
Á Terminal-Bench 2.0 heldur Claude Opus 4.6 hæsta skorinu, á undan GPT-5.2-Codex 64.0%. Á SWE-Bench Pro skorar GPT-5.2-Codex 56.4%. Líkönin tvö taka ólíkar nálganir: GPT-5.2-Codex býður stærri inntakssamhengi (400K tókar á móti 200K hjá Claude) og lægra verð, á meðan Claude Opus 4.6 býður agenthópa og hærri viðmiðaskor á rökhugsanaverkefnum.

Fylgstu með

Fáðu nýjustu gervigreindarfréttirnar í pósthólfið.

Deila