GPT-5.2-Codex Benchmark-Ergebnisse
OpenAI veröffentlichte GPT-5.2-Codex am 14. Januar 2026, fünf Wochen nach dem Basis-GPT-5.2-Modell. Es zielt auf agentisches Coding: mehrstufige Sessions, in denen das Modell plant, Code schreibt, Tests ausführt und bei Fehlern iteriert.
Das Modell erzielt 56.4% auf SWE-Bench Pro (gegenüber 55.6% beim Basis-GPT-5.2) und 64.0% auf Terminal-Bench 2.0 (gegenüber 62.2%). Beide Benchmarks testen reale Coding-Aufgaben, keine isolierte Codegenerierung.
GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6
| Benchmark | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | 56.4% | 55.6% | — |
| Terminal-Bench 2.0 | 64.0% | 62.2% | #1 |
| Kontextfenster (Eingabe) | 400K | 128K | 200K (1M Beta) |
| Ausgabe-Tokens | 128K | 128K | 128K |
GPT-5.2-Codex balanciert Kosten und Leistung. Claude Opus 4.6 führt bei Terminal-Bench 2.0 und Humanity's Last Exam, während GPT-5.2-Codex beim Preis und der Kontextfenstergröße konkurriert.
Wichtige Funktionen für Entwickler
Kontextkomprimierung
Ähnlich wie die Komprimierungsfunktion von Claude Opus 4.6 komprimiert GPT-5.2-Codex früheren Kontext unter Beibehaltung des Aufgabenzustands. Dies ermöglicht mehrstündige Coding-Sessions, bei denen das Modell das gesamte Projekt verfolgt, auch wenn die Konversation das Kontextfenster überschreitet.
Langfristige Aufgabenerledigung
Das Modell ist für Aufgaben optimiert, die viele Schritte umfassen: große Refactorings, Codebase-Migrationen und Multi-Datei-Feature-Implementierungen. Wenn ein Ansatz scheitert, passt GPT-5.2-Codex sich an und versucht es erneut, anstatt die Aufgabe neu zu starten.
Integrierte Schwachstellenerkennung
GPT-5.2-Codex beinhaltet Schwachstellenerkennung während der Codegenerierung. Teams, die tiefergehende Scans benötigen, können dedizierte Tools wie Claude Code Security nutzen, das mehrstufige Verifizierung mit Falsch-Positiv-Filterung bietet.
Windows-Umgebungsunterstützung
OpenAI verbesserte die Windows-Entwicklungsleistung von GPT-5.2-Codex und adressierte die Unix-zentrierte Optimierung früherer Modelle.
GPT-5.2-Codex Preise
| Stufe | Kosten pro Million Tokens |
|---|---|
| Eingabe | $1.75 |
| Ausgabe | $14.00 |
| Gecachte Eingabe | $0.175 (90% Rabatt) |
GPT-5.2-Codex ist über alle Codex-Oberflächen für zahlende ChatGPT-Nutzer und als eigenständiges API-Modell verfügbar.
Was GPT-5.2-Codex für agentisches Coding bedeutet
Die Veröffentlichung spiegelt einen branchenweiten Wandel von Code-Vervollständigung zu nachhaltigen Coding-Agenten wider. OpenAIs Codex, Anthropics Claude Code und GitHub Agentic Workflows zielen alle auf mehrstufige Engineering-Aufgaben mit minimaler menschlicher Intervention.
Originalquelle
https://openai.com/index/introducing-gpt-5-2-codex/Häufig gestellte Fragen
Was ist GPT-5.2-Codex?
Was kostet GPT-5.2-Codex?
Was ist Kontextkomprimierung bei GPT-5.2-Codex?
Wie schneidet GPT-5.2-Codex im Vergleich zu Claude Opus 4.6 ab?
Bleiben Sie informiert
Erhalten Sie die neuesten KI-Nachrichten per E-Mail.
