Wyniki benchmarków GPT-5.2-Codex
OpenAI wydało GPT-5.2-Codex 14 stycznia 2026 roku, pięć tygodni po bazowym modelu GPT-5.2. Model jest ukierunkowany na agentowe programowanie: wieloetapowe sesje, w których model planuje, pisze kod, uruchamia testy i iteruje nad błędami.
Model uzyskuje 56,4% na SWE-Bench Pro (wzrost z 55,6% dla bazowego GPT-5.2) i 64,0% na Terminal-Bench 2.0 (wzrost z 62,2%). Oba benchmarki testują rzeczywiste zadania programistyczne, nie izolowane generowanie kodu.
GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6
| Benchmark | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | 56,4% | 55,6% | — |
| Terminal-Bench 2.0 | 64,0% | 62,2% | #1 |
| Okno kontekstowe (wejście) | 400K | 128K | 200K (1M beta) |
| Tokeny wyjściowe | 128K | 128K | 128K |
GPT-5.2-Codex równoważy koszt i wydajność. Claude Opus 4.6 prowadzi na Terminal-Bench 2.0 i Humanity's Last Exam, podczas gdy GPT-5.2-Codex konkuruje ceną i rozmiarem okna kontekstowego.
Kluczowe funkcje dla programistów
Context Compaction
Podobnie jak funkcja compaction w Claude Opus 4.6, GPT-5.2-Codex kompresuje wcześniejszy kontekst, zachowując stan zadania. Umożliwia to wielogodzinne sesje programowania, w których model śledzi cały projekt nawet gdy rozmowa przekracza okno kontekstowe.
Realizacja zadań długoterminowych
Model jest zoptymalizowany pod kątem zadań obejmujących wiele kroków: duże refaktoryzacje, migracje baz kodu i implementacje funkcji w wielu plikach. Gdy podejście zawodzi, GPT-5.2-Codex dostosowuje strategię i ponawia próbę zamiast restartować zadanie.
Wbudowane wykrywanie podatności
GPT-5.2-Codex zawiera wykrywanie podatności podczas generowania kodu. Zespoły potrzebujące głębszego skanowania mogą korzystać ze specjalistycznych narzędzi, takich jak Claude Code Security, które oferuje wieloetapową weryfikację z filtrowaniem fałszywych alarmów.
Wsparcie dla środowiska Windows
OpenAI poprawiło wydajność GPT-5.2-Codex w środowisku Windows, eliminując optymalizację skoncentrowaną na Unix z wcześniejszych modeli.
Cennik GPT-5.2-Codex
| Poziom | Koszt za milion tokenów |
|---|---|
| Wejście | $1,75 |
| Wyjście | $14,00 |
| Wejście z cache | $0,175 (90% zniżki) |
GPT-5.2-Codex jest dostępny na wszystkich platformach Codex dla płatnych użytkowników ChatGPT oraz jako samodzielny model API.
Co GPT-5.2-Codex oznacza dla agentowego programowania
Ta premiera odzwierciedla branżowe przesunięcie od uzupełniania kodu do pełnoprawnych agentów programistycznych. Codex od OpenAI, Claude Code od Anthropic i GitHub Agentic Workflows wszystkie celują w wieloetapowe zadania inżynieryjne z minimalną interwencją człowieka.
Źródło oryginalne
https://openai.com/index/introducing-gpt-5-2-codex/Często zadawane pytania
Czym jest GPT-5.2-Codex?
Ile kosztuje GPT-5.2-Codex?
Czym jest context compaction w GPT-5.2-Codex?
Jak GPT-5.2-Codex wypada w porównaniu z Claude Opus 4.6?
Bądź na bieżąco
Otrzymuj najnowsze wiadomości o AI na swoją skrzynkę.
