Risultati benchmark di GPT-5.2-Codex
OpenAI ha rilasciato GPT-5.2-Codex il 14 gennaio 2026, cinque settimane dopo il modello base GPT-5.2. È orientato al coding agentico: sessioni multi-step in cui il modello pianifica, scrive codice, esegue test e itera sugli errori.
Il modello ottiene 56,4% su SWE-Bench Pro (rispetto al 55,6% del GPT-5.2 base) e 64,0% su Terminal-Bench 2.0 (rispetto al 62,2%). Entrambi i benchmark testano attività di coding reali, non generazione di codice isolata.
GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6
| Benchmark | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | 56,4% | 55,6% | — |
| Terminal-Bench 2.0 | 64,0% | 62,2% | #1 |
| Finestra di contesto (input) | 400K | 128K | 200K (1M beta) |
| Token in output | 128K | 128K | 128K |
GPT-5.2-Codex bilancia costo e performance. Claude Opus 4.6 guida Terminal-Bench 2.0 e Humanity's Last Exam, mentre GPT-5.2-Codex compete su prezzo e dimensione della finestra di contesto.
Funzionalità chiave per gli sviluppatori
Context Compaction
Come la funzionalità di compaction di Claude Opus 4.6, GPT-5.2-Codex comprime il contesto precedente preservando lo stato dell'attività. Questo consente sessioni di coding di più ore in cui il modello tiene traccia dell'intero progetto anche quando la conversazione supera la finestra di contesto.
Completamento di attività a lungo termine
Il modello è ottimizzato per attività che richiedono molti passaggi: refactoring su larga scala, migrazioni di codebase e implementazioni di funzionalità multi-file. Quando un approccio fallisce, GPT-5.2-Codex corregge e riprova invece di ricominciare l'attività da zero.
Rilevamento vulnerabilità integrato
GPT-5.2-Codex include il rilevamento di vulnerabilità durante la generazione del codice. I team che necessitano di scansioni più approfondite possono usare strumenti dedicati come Claude Code Security, che offre verifica multi-stadio con filtraggio dei falsi positivi.
Supporto per l'ambiente Windows
OpenAI ha migliorato le prestazioni di GPT-5.2-Codex su Windows, superando l'ottimizzazione incentrata su Unix dei modelli precedenti.
Prezzi di GPT-5.2-Codex
| Livello | Costo per milione di token |
|---|---|
| Input | $1,75 |
| Output | $14,00 |
| Input in cache | $0,175 (sconto 90%) |
GPT-5.2-Codex è disponibile su tutte le piattaforme Codex per gli utenti ChatGPT a pagamento e come modello API indipendente.
Cosa significa GPT-5.2-Codex per il coding agentico
Il rilascio riflette un cambiamento settoriale dal completamento del codice ad agenti di coding completi. Codex di OpenAI, Claude Code di Anthropic e GitHub Agentic Workflows puntano tutti su attività di ingegneria multi-step con intervento umano minimo.
Fonte originale
https://openai.com/index/introducing-gpt-5-2-codex/Domande Frequenti
Cos'è GPT-5.2-Codex?
Quanto costa GPT-5.2-Codex?
Cos'è il context compaction in GPT-5.2-Codex?
Come si confronta GPT-5.2-Codex con Claude Opus 4.6?
Resta aggiornato
Ricevi le ultime notizie sull'IA nella tua casella.
