GPT-5.2-Codex benchmarkresultat
OpenAI släppte GPT-5.2-Codex den 14 januari 2026, fem veckor efter bas-GPT-5.2-modellen. Den riktar sig mot agentisk kodning: flerstegsessioner där modellen planerar, skriver kod, kör tester och itererar på misslyckanden.
Modellen uppnår 56,4% på SWE-Bench Pro (upp från 55,6% på bas-GPT-5.2) och 64,0% på Terminal-Bench 2.0 (upp från 62,2%). Båda benchmarken testar verkliga kodningsuppgifter, inte isolerad kodgenerering.
GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6
| Benchmark | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | 56,4% | 55,6% | — |
| Terminal-Bench 2.0 | 64,0% | 62,2% | #1 |
| Kontextfönster (indata) | 400K | 128K | 200K (1M beta) |
| Utdata-tokens | 128K | 128K | 128K |
GPT-5.2-Codex balanserar kostnad och prestanda. Claude Opus 4.6 leder Terminal-Bench 2.0 och Humanity's Last Exam, medan GPT-5.2-Codex konkurrerar på pris och kontextfönsterstorlek.
Nyckelfunktioner för utvecklare
Context Compaction
Liksom Claude Opus 4.6:s compaction-funktion komprimerar GPT-5.2-Codex tidigare kontext samtidigt som uppgiftsläget bevaras. Detta möjliggör kodningssessioner på flera timmar där modellen håller koll på hela projektet även när konversationen överskrider kontextfönstret.
Långsiktigt uppgiftsslutförande
Modellen är optimerad för uppgifter som sträcker sig över många steg: stora refaktoreringar, kodbasmigreringar och flerfilsimplementationer av funktioner. När ett tillvägagångssätt misslyckas justerar GPT-5.2-Codex och försöker igen istället för att starta om uppgiften.
Inbyggd sårbarhetsdetektering
GPT-5.2-Codex inkluderar sårbarhetsdetektering under kodgenerering. Team som behöver djupare scanning kan använda dedikerade verktyg som Claude Code Security, som erbjuder flerstegsverifiering med filtrering av falska positiva.
Stöd för Windows-miljö
OpenAI förbättrade GPT-5.2-Codex:s prestanda i Windows-utvecklingsmiljöer, vilket åtgärdar den Unix-centriska optimeringen hos tidigare modeller.
GPT-5.2-Codex prissättning
| Nivå | Kostnad per miljon tokens |
|---|---|
| Indata | $1,75 |
| Utdata | $14,00 |
| Cachade indata | $0,175 (90% rabatt) |
GPT-5.2-Codex är tillgänglig via alla Codex-ytor för betalande ChatGPT-användare och som en fristående API-modell.
Vad GPT-5.2-Codex betyder för agentisk kodning
Lanseringen speglar en branschomfattande förskjutning från kodkomplettering till ihållande kodningsagenter. OpenAI:s Codex, Anthropics Claude Code och GitHub Agentic Workflows riktar alla in sig på flerstegs ingenjörsuppgifter med minimal mänsklig inblandning.
Originalkälla
https://openai.com/index/introducing-gpt-5-2-codex/Vanliga frågor
Vad är GPT-5.2-Codex?
Hur mycket kostar GPT-5.2-Codex?
Vad är context compaction i GPT-5.2-Codex?
Hur jämför sig GPT-5.2-Codex med Claude Opus 4.6?
Håll dig uppdaterad
Få de senaste AI-nyheterna i din inkorg.
