Rezultatele Benchmark GPT-5.2-Codex
OpenAI a lansat GPT-5.2-Codex pe 14 ianuarie 2026, la cinci săptămâni după modelul de bază GPT-5.2. Este construit pentru programare agentică: sesiuni susținute în mai mulți pași unde modelul planifică, scrie cod, rulează teste și iterează pe eșecuri.
Modelul obține 56.4% pe SWE-Bench Pro (față de 55.6% pe GPT-5.2 de bază) și 64.0% pe Terminal-Bench 2.0 (față de 62.2%). Ambele benchmark-uri testează sarcini reale de programare, nu generare izolată de cod.
GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6
| Benchmark | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | 56.4% | 55.6% | — |
| Terminal-Bench 2.0 | 64.0% | 62.2% | #1 |
| Context (intrare) | 400K | 128K | 200K (1M beta) |
| Tokeni ieșire | 128K | 128K | 128K |
GPT-5.2-Codex echilibrează costul și performanța. Claude Opus 4.6 conduce Terminal-Bench 2.0 și Humanity's Last Exam, în timp ce GPT-5.2-Codex concurează prin preț și dimensiunea contextului.
Funcționalități Cheie pentru Dezvoltatori
Compactarea Contextului
Similar cu funcționalitatea de compactare din Claude Opus 4.6, GPT-5.2-Codex poate comprima contextul anterior păstrând starea sarcinii. Acest lucru permite sesiuni de programare de mai multe ore în care modelul menține urmărirea întregului proiect chiar și când conversația depășește fereastra de context.
Finalizarea Sarcinilor pe Termen Lung
Modelul este optimizat pentru sarcini care acoperă mulți pași: refactorizări ample, migrări de codebase și implementări de funcționalități în mai multe fișiere. Când o abordare eșuează, GPT-5.2-Codex ajustează și reîncearcă în loc să repornească sarcina.
Detectarea Vulnerabilităților Integrată
GPT-5.2-Codex include detectarea vulnerabilităților în timpul generării codului. Echipele care au nevoie de scanare mai aprofundată pot folosi instrumente dedicate precum Claude Code Security, care oferă verificare multi-etapă cu filtrarea pozitivelor false.
Suport pentru Mediul Windows
OpenAI a îmbunătățit performanța GPT-5.2-Codex pe fluxuri de lucru de dezvoltare Windows, corectând optimizarea centrată pe Unix din modelele anterioare.
Prețuri GPT-5.2-Codex
| Nivel | Cost per Milion de Tokeni |
|---|---|
| Intrare | $1.75 |
| Ieșire | $14.00 |
| Intrare din cache | $0.175 (reducere 90%) |
GPT-5.2-Codex este disponibil pe toate platformele Codex pentru utilizatorii plătiți ChatGPT și ca model API standalone.
Ce Înseamnă GPT-5.2-Codex pentru Programarea Agentică
Lansarea continuă o tendință la nivel de industrie: modelele de IA trec de la completarea codului la agenți de programare susținuți. Codex de la OpenAI, Claude Code de la Anthropic și GitHub Agentic Workflows vizează sarcini de inginerie în mai mulți pași cu intervenție umană minimă.
Sursa originală
https://openai.com/index/introducing-gpt-5-2-codex/Întrebări frecvente
Ce este GPT-5.2-Codex?
Cât costă GPT-5.2-Codex?
Ce este compactarea contextului în GPT-5.2-Codex?
Cum se compară GPT-5.2-Codex cu Claude Opus 4.6?
Rămâi la curent
Primește ultimele știri AI în inbox-ul tău.
