GPT-5.2-Codex Benchmark Sonuçları
OpenAI, temel GPT-5.2 modelinden beş hafta sonra, 14 Ocak 2026'da GPT-5.2-Codex'i yayınladı. Model, ajantik kodlamayı hedefler: modelin planlama yaptığı, kod yazdığı, testler çalıştırdığı ve hataları düzelttiği çok adımlı oturumlar.
Model, SWE-Bench Pro'da %56,4 (temel GPT-5.2'nin %55,6'sından yüksek) ve Terminal-Bench 2.0'da %64,0 (%62,2'den yüksek) puan almıştır. Her iki benchmark da izole kod üretimi yerine gerçek dünya kodlama görevlerini test eder.
GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6
| Benchmark | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | %56,4 | %55,6 | — |
| Terminal-Bench 2.0 | %64,0 | %62,2 | #1 |
| Bağlam Penceresi (giriş) | 400K | 128K | 200K (1M beta) |
| Çıkış Token | 128K | 128K | 128K |
GPT-5.2-Codex, maliyet ve performans arasında denge kurar. Claude Opus 4.6 Terminal-Bench 2.0 ve Humanity's Last Exam'da lider konumdayken, GPT-5.2-Codex fiyat ve bağlam penceresi boyutunda rekabet eder.
Geliştiriciler İçin Temel Özellikler
Bağlam Sıkıştırma
Claude Opus 4.6'nın sıkıştırma özelliğine benzer şekilde, GPT-5.2-Codex görev durumunu korurken önceki bağlamı sıkıştırır. Bu, konuşma bağlam penceresini aşsa bile modelin tüm projeyi takip ettiği çok saatlik kodlama oturumlarını mümkün kılar.
Uzun Vadeli Görev Tamamlama
Model, birçok adımı kapsayan görevler için optimize edilmiştir: büyük yeniden düzenlemeler, kod tabanı geçişleri ve çok dosyalı özellik uygulamaları. Bir yaklaşım başarısız olduğunda, GPT-5.2-Codex görevi yeniden başlatmak yerine ayarlama yapar ve tekrar dener.
Yerleşik Güvenlik Açığı Tespiti
GPT-5.2-Codex, kod üretimi sırasında güvenlik açığı tespiti içerir. Daha derin tarama ihtiyacı olan ekipler, yanlış pozitif filtreleme ile çok aşamalı doğrulama sunan Claude Code Security gibi özel araçlar kullanabilir.
Windows Ortam Desteği
OpenAI, önceki modellerin Unix odaklı optimizasyonunu ele alarak GPT-5.2-Codex'in Windows geliştirme performansını iyileştirdi.
GPT-5.2-Codex Fiyatlandırma
| Katman | Milyon Token Başına Maliyet |
|---|---|
| Giriş | $1,75 |
| Çıkış | $14,00 |
| Önbelleğe Alınmış Giriş | $0,175 (%90 indirim) |
GPT-5.2-Codex, ücretli ChatGPT kullanıcıları için tüm Codex yüzeylerinde ve bağımsız bir API modeli olarak kullanılabilir.
GPT-5.2-Codex'in Ajantik Kodlama İçin Anlamı
Bu sürüm, sektör genelinde kod tamamlamadan sürdürülebilir kodlama ajanlarına doğru bir geçişi yansıtır. OpenAI'ın Codex'i, Anthropic'in Claude Code'u ve GitHub Agentic Workflows hepsi minimum insan müdahalesiyle çok adımlı mühendislik görevlerini hedefler.
Orijinal kaynak
https://openai.com/index/introducing-gpt-5-2-codex/Sık Sorulan Sorular
GPT-5.2-Codex nedir?
GPT-5.2-Codex'in maliyeti ne kadar?
GPT-5.2-Codex'te bağlam sıkıştırma nedir?
GPT-5.2-Codex ile Claude Opus 4.6 nasıl karşılaştırılır?
Güncel Kalın
En son yapay zeka haberlerini e-postanıza alın.
