Code Velocity
Yapay Zeka Modelleri

GPT-5.2-Codex: OpenAI'ın Ajantik Kodlama Modeli

·6 dk okuma·OpenAI·Orijinal kaynak
Paylaş
GPT-5.2-Codex benchmark grafiği: SWE-Bench Pro ve Terminal-Bench 2.0 puanlarının GPT-5.2 temel modelle karşılaştırması

GPT-5.2-Codex Benchmark Sonuçları

OpenAI, temel GPT-5.2 modelinden beş hafta sonra, 14 Ocak 2026'da GPT-5.2-Codex'i yayınladı. Model, ajantik kodlamayı hedefler: modelin planlama yaptığı, kod yazdığı, testler çalıştırdığı ve hataları düzelttiği çok adımlı oturumlar.

Model, SWE-Bench Pro'da %56,4 (temel GPT-5.2'nin %55,6'sından yüksek) ve Terminal-Bench 2.0'da %64,0 (%62,2'den yüksek) puan almıştır. Her iki benchmark da izole kod üretimi yerine gerçek dünya kodlama görevlerini test eder.

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

BenchmarkGPT-5.2-CodexGPT-5.2Claude Opus 4.6
SWE-Bench Pro%56,4%55,6
Terminal-Bench 2.0%64,0%62,2#1
Bağlam Penceresi (giriş)400K128K200K (1M beta)
Çıkış Token128K128K128K

GPT-5.2-Codex, maliyet ve performans arasında denge kurar. Claude Opus 4.6 Terminal-Bench 2.0 ve Humanity's Last Exam'da lider konumdayken, GPT-5.2-Codex fiyat ve bağlam penceresi boyutunda rekabet eder.

Geliştiriciler İçin Temel Özellikler

Bağlam Sıkıştırma

Claude Opus 4.6'nın sıkıştırma özelliğine benzer şekilde, GPT-5.2-Codex görev durumunu korurken önceki bağlamı sıkıştırır. Bu, konuşma bağlam penceresini aşsa bile modelin tüm projeyi takip ettiği çok saatlik kodlama oturumlarını mümkün kılar.

Uzun Vadeli Görev Tamamlama

Model, birçok adımı kapsayan görevler için optimize edilmiştir: büyük yeniden düzenlemeler, kod tabanı geçişleri ve çok dosyalı özellik uygulamaları. Bir yaklaşım başarısız olduğunda, GPT-5.2-Codex görevi yeniden başlatmak yerine ayarlama yapar ve tekrar dener.

Yerleşik Güvenlik Açığı Tespiti

GPT-5.2-Codex, kod üretimi sırasında güvenlik açığı tespiti içerir. Daha derin tarama ihtiyacı olan ekipler, yanlış pozitif filtreleme ile çok aşamalı doğrulama sunan Claude Code Security gibi özel araçlar kullanabilir.

Windows Ortam Desteği

OpenAI, önceki modellerin Unix odaklı optimizasyonunu ele alarak GPT-5.2-Codex'in Windows geliştirme performansını iyileştirdi.

GPT-5.2-Codex Fiyatlandırma

KatmanMilyon Token Başına Maliyet
Giriş$1,75
Çıkış$14,00
Önbelleğe Alınmış Giriş$0,175 (%90 indirim)

GPT-5.2-Codex, ücretli ChatGPT kullanıcıları için tüm Codex yüzeylerinde ve bağımsız bir API modeli olarak kullanılabilir.

GPT-5.2-Codex'in Ajantik Kodlama İçin Anlamı

Bu sürüm, sektör genelinde kod tamamlamadan sürdürülebilir kodlama ajanlarına doğru bir geçişi yansıtır. OpenAI'ın Codex'i, Anthropic'in Claude Code'u ve GitHub Agentic Workflows hepsi minimum insan müdahalesiyle çok adımlı mühendislik görevlerini hedefler.

Sık Sorulan Sorular

GPT-5.2-Codex nedir?
GPT-5.2-Codex, OpenAI'ın 14 Ocak 2026'da yayınlanan, kodlama için optimize edilmiş GPT-5.2 model varyantıdır. Modelin çok adımlı, sürdürülebilir yazılım mühendisliği oturumları yürüttüğü ajantik kodlama iş akışları için özel olarak tasarlanmıştır. SWE-Bench Pro'da %56,4 ve Terminal-Bench 2.0'da %64,0 puan alarak, temel GPT-5.2 modelinin sırasıyla %55,6 ve %62,2'lik puanlarını geride bırakmıştır. Model, 400K giriş ve 128K çıkış bağlam penceresi destekler.
GPT-5.2-Codex'in maliyeti ne kadar?
GPT-5.2-Codex, milyon giriş token başına $1,75 ve milyon çıkış token başına $14 maliyetindedir. Önbelleğe alınmış girişler %90 indirim alır ve efektif önbellek fiyatı milyon token başına $0,175'e düşer. Bu, $5/$25 milyon token başına fiyatlandırılan Claude Opus 4.6'dan önemli ölçüde daha ucuzdur; ancak iki model benchmark performansı ve özellik setleri açısından farklılık gösterir.
GPT-5.2-Codex'te bağlam sıkıştırma nedir?
Bağlam sıkıştırma, kritik görev durumunu korurken önceki konuşma bağlamını sıkıştıran bir özelliktir. Bu, GPT-5.2-Codex'in proje kapsamını kaybetmeden çok saatlik kodlama oturumlarını sürdürmesini sağlar. Bir oturum bağlam penceresi sınırına yaklaştığında, model eski bağlamı silmek yerine özetler ve böylece yeniden başlatmaya gerek kalmadan daha uzun ve karmaşık kodlama görevlerini mümkün kılar.
GPT-5.2-Codex ile Claude Opus 4.6 nasıl karşılaştırılır?
Terminal-Bench 2.0'da Claude Opus 4.6, GPT-5.2-Codex'in %64,0'ının önünde en yüksek puanı elinde tutmaktadır. SWE-Bench Pro'da GPT-5.2-Codex %56,4 puan almıştır. İki model farklı yaklaşımlar benimser: GPT-5.2-Codex daha büyük giriş bağlamı (400K token, Claude'un standart 200K'sına karşı) ve daha düşük fiyatlandırma sunarken, Claude Opus 4.6 agent teams ve Humanity's Last Exam gibi akıl yürütme görevlerinde daha yüksek benchmark puanları sunar.

Güncel Kalın

En son yapay zeka haberlerini e-postanıza alın.

Paylaş