Результаты бенчмарков GPT-5.2-Codex
OpenAI выпустила GPT-5.2-Codex 14 января 2026 года, через пять недель после базовой модели GPT-5.2. Модель ориентирована на агентное программирование: многоэтапные сессии, где модель планирует, пишет код, запускает тесты и исправляет ошибки.
Модель набирает 56,4% на SWE-Bench Pro (рост с 55,6% у базовой GPT-5.2) и 64,0% на Terminal-Bench 2.0 (рост с 62,2%). Оба бенчмарка тестируют реальные задачи программирования, а не изолированную генерацию кода.
GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6
| Бенчмарк | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | 56,4% | 55,6% | — |
| Terminal-Bench 2.0 | 64,0% | 62,2% | #1 |
| Контекстное окно (вход) | 400K | 128K | 200K (1M бета) |
| Выходные токены | 128K | 128K | 128K |
GPT-5.2-Codex сочетает стоимость и производительность. Claude Opus 4.6 лидирует на Terminal-Bench 2.0 и Humanity's Last Exam, тогда как GPT-5.2-Codex конкурирует ценой и размером контекстного окна.
Ключевые функции для разработчиков
Context Compaction
Как и функция compaction в Claude Opus 4.6, GPT-5.2-Codex сжимает ранний контекст, сохраняя состояние задачи. Это позволяет вести многочасовые сессии программирования, где модель отслеживает весь проект, даже когда разговор превышает контекстное окно.
Выполнение долгосрочных задач
Модель оптимизирована для задач, охватывающих множество шагов: крупные рефакторинги, миграции кодовых баз и реализация функций в нескольких файлах. Когда подход не срабатывает, GPT-5.2-Codex корректирует стратегию и повторяет попытку, а не начинает задачу заново.
Встроенное обнаружение уязвимостей
GPT-5.2-Codex включает обнаружение уязвимостей при генерации кода. Команды, которым нужно более глубокое сканирование, могут использовать специализированные инструменты, такие как Claude Code Security, предлагающий многоэтапную верификацию с фильтрацией ложных срабатываний.
Поддержка среды Windows
OpenAI улучшила производительность GPT-5.2-Codex в среде Windows, устранив ориентацию на Unix, характерную для более ранних моделей.
Цены на GPT-5.2-Codex
| Уровень | Стоимость за миллион токенов |
|---|---|
| Вход | $1,75 |
| Выход | $14,00 |
| Кэшированный вход | $0,175 (скидка 90%) |
GPT-5.2-Codex доступен во всех интерфейсах Codex для платных пользователей ChatGPT и как отдельная API-модель.
Что GPT-5.2-Codex означает для агентного программирования
Этот релиз отражает отраслевой сдвиг от автодополнения кода к полноценным агентам программирования. Codex от OpenAI, Claude Code от Anthropic и GitHub Agentic Workflows — все ориентированы на многоэтапные инженерные задачи с минимальным участием человека.
Первоисточник
https://openai.com/index/introducing-gpt-5-2-codex/Часто задаваемые вопросы
Что такое GPT-5.2-Codex?
Сколько стоит GPT-5.2-Codex?
Что такое context compaction в GPT-5.2-Codex?
Как GPT-5.2-Codex сравнивается с Claude Opus 4.6?
Будьте в курсе
Получайте последние новости ИИ на почту.
