Resultats de benchmarks de GPT-5.2-Codex
OpenAI va llançar GPT-5.2-Codex el 14 de gener de 2026, cinc setmanes després del model base GPT-5.2. Està orientat al codi agèntic: sessions de múltiples passos on el model planifica, escriu codi, executa proves i itera sobre els errors.
El model obté un 56,4% a SWE-Bench Pro (pujant des del 55,6% del GPT-5.2 base) i un 64,0% a Terminal-Bench 2.0 (pujant des del 62,2%). Ambdós benchmarks avaluen tasques de codi del món real, no generació de codi aïllada.
GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6
| Benchmark | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | 56,4% | 55,6% | — |
| Terminal-Bench 2.0 | 64,0% | 62,2% | #1 |
| Finestra de context (entrada) | 400K | 128K | 200K (1M beta) |
| Tokens de sortida | 128K | 128K | 128K |
GPT-5.2-Codex equilibra cost i rendiment. Claude Opus 4.6 lidera Terminal-Bench 2.0 i Humanity's Last Exam, mentre que GPT-5.2-Codex competeix en preu i mida de finestra de context.
Funcionalitats clau per a desenvolupadors
Compactació de context
Com la funcionalitat de compactació de Claude Opus 4.6, GPT-5.2-Codex comprimeix el context anterior mantenint l'estat de la tasca. Això permet sessions de codi de diverses hores on el model fa seguiment del projecte complet fins i tot quan la conversa supera la finestra de context.
Completament de tasques de llarg termini
El model està optimitzat per a tasques que abarquen molts passos: refactoritzacions grans, migracions de codi i implementacions de funcionalitats en múltiples fitxers. Quan un enfocament falla, GPT-5.2-Codex s'ajusta i reintenta en lloc de reiniciar la tasca.
Detecció de vulnerabilitats integrada
GPT-5.2-Codex inclou detecció de vulnerabilitats durant la generació de codi. Els equips que necessiten escanejos més profunds poden utilitzar eines dedicades com Claude Code Security, que ofereix verificació en múltiples etapes amb filtratge de falsos positius.
Suport per a entorn Windows
OpenAI va millorar el rendiment de GPT-5.2-Codex en entorns de desenvolupament Windows, abordant l'optimització centrada en Unix dels models anteriors.
Preus de GPT-5.2-Codex
| Nivell | Cost per milió de tokens |
|---|---|
| Entrada | $1,75 |
| Sortida | $14,00 |
| Entrada en memòria cau | $0,175 (descompte del 90%) |
GPT-5.2-Codex està disponible a totes les superfícies de Codex per a usuaris de pagament de ChatGPT i com a model d'API independent.
Què significa GPT-5.2-Codex per al codi agèntic
El llançament reflecteix un canvi sectorial de la completació de codi cap als agents de codi sostinguts. Codex d'OpenAI, Claude Code d'Anthropic i els GitHub Agentic Workflows apunten tots a tasques d'enginyeria de múltiples passos amb mínima intervenció humana.
Font original
https://openai.com/index/introducing-gpt-5-2-codex/Preguntes freqüents
Què és GPT-5.2-Codex?
Quant costa GPT-5.2-Codex?
Què és la compactació de context a GPT-5.2-Codex?
Com es compara GPT-5.2-Codex amb Claude Opus 4.6?
Manteniu-vos al dia
Rebeu les últimes notícies d'IA al correu.
