Resultados de Benchmark de GPT-5.2-Codex
OpenAI lanzó GPT-5.2-Codex el 14 de enero de 2026, cinco semanas después del modelo base GPT-5.2. Está orientado a la codificación agéntica: sesiones de múltiples pasos donde el modelo planifica, escribe código, ejecuta pruebas e itera sobre los fallos.
El modelo obtiene 56.4% en SWE-Bench Pro (frente al 55.6% del GPT-5.2 base) y 64.0% en Terminal-Bench 2.0 (frente al 62.2%). Ambos benchmarks evalúan tareas de programación del mundo real, no generación de código aislada.
GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6
| Benchmark | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | 56.4% | 55.6% | — |
| Terminal-Bench 2.0 | 64.0% | 62.2% | #1 |
| Ventana de contexto (entrada) | 400K | 128K | 200K (1M beta) |
| Tokens de salida | 128K | 128K | 128K |
GPT-5.2-Codex equilibra costo y rendimiento. Claude Opus 4.6 lidera Terminal-Bench 2.0 y Humanity's Last Exam, mientras que GPT-5.2-Codex compite en precio y tamaño de ventana de contexto.
Funcionalidades Clave para Desarrolladores
Compactación de Contexto
Al igual que la función de compactación de Claude Opus 4.6, GPT-5.2-Codex comprime el contexto anterior preservando el estado de la tarea. Esto permite sesiones de codificación de varias horas donde el modelo rastrea todo el proyecto incluso cuando la conversación excede la ventana de contexto.
Completado de Tareas de Largo Plazo
El modelo está optimizado para tareas que abarcan muchos pasos: grandes refactorizaciones, migraciones de código base y desarrollo de funcionalidades multi-archivo. Cuando un enfoque falla, GPT-5.2-Codex se ajusta y reintenta en lugar de reiniciar la tarea.
Detección de Vulnerabilidades Integrada
GPT-5.2-Codex incluye detección de vulnerabilidades durante la generación de código. Los equipos que necesiten un escaneo más profundo pueden usar herramientas dedicadas como Claude Code Security, que ofrece verificación en múltiples etapas con filtrado de falsos positivos.
Soporte para Entornos Windows
OpenAI mejoró el rendimiento de GPT-5.2-Codex en desarrollo para Windows, abordando la optimización centrada en Unix de modelos anteriores.
Precios de GPT-5.2-Codex
| Nivel | Costo por Millón de Tokens |
|---|---|
| Entrada | $1.75 |
| Salida | $14.00 |
| Entrada en caché | $0.175 (90% descuento) |
GPT-5.2-Codex está disponible en todas las superficies Codex para usuarios de ChatGPT de pago y como modelo API independiente.
Qué Significa GPT-5.2-Codex para la Codificación Agéntica
El lanzamiento refleja un cambio a nivel industrial desde la completación de código hacia agentes de codificación sostenida. El Codex de OpenAI, el Claude Code de Anthropic y los GitHub Agentic Workflows apuntan a tareas de ingeniería de múltiples pasos con mínima intervención humana.
Fuente original
https://openai.com/index/introducing-gpt-5-2-codex/Preguntas Frecuentes
¿Qué es GPT-5.2-Codex?
¿Cuánto cuesta GPT-5.2-Codex?
¿Qué es la compactación de contexto en GPT-5.2-Codex?
¿Cómo se compara GPT-5.2-Codex con Claude Opus 4.6?
Mantente Actualizado
Recibe las últimas noticias de IA en tu correo.
