Code Velocity
Süni İntellekt Modelləri

GPT-5.2-Codex: OpenAI-nin Agentik Kodlaşdırma Modeli

·6 dəq oxunma·OpenAI·Orijinal mənbə
Paylaş
GPT-5.2-Codex benchmark qrafiki: SWE-Bench Pro və Terminal-Bench 2.0 nəticələri GPT-5.2 baza modeli ilə müqayisədə

GPT-5.2-Codex Benchmark Nəticələri

OpenAI GPT-5.2-Codex-i 14 yanvar 2026-cı ildə, baza GPT-5.2 modelindən beş həftə sonra buraxdı. Model agentik kodlaşdırmanı hədəfləyir: modelin plan qurduğu, kod yazdığı, testlər işlətdiyi və uğursuzluqlar üzərində təkrar işlədiyi çoxaddımlı sessiyalar.

Model SWE-Bench Pro-da 56.4% (baza GPT-5.2-dəki 55.6%-dən yuxarı) və Terminal-Bench 2.0-da 64.0% (62.2%-dən yuxarı) nəticə göstərir. Hər iki benchmark təcrid olunmuş kod generasiyasını deyil, real dünya kodlaşdırma tapşırıqlarını test edir.

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

BenchmarkGPT-5.2-CodexGPT-5.2Claude Opus 4.6
SWE-Bench Pro56.4%55.6%
Terminal-Bench 2.064.0%62.2%#1
Kontekst Pəncərəsi (giriş)400K128K200K (1M beta)
Çıxış Tokenləri128K128K128K

GPT-5.2-Codex qiymət və performans arasında balans yaradır. Claude Opus 4.6 Terminal-Bench 2.0 və Humanity's Last Exam-da liderdir, GPT-5.2-Codex isə qiymət və kontekst pəncərəsi ölçüsündə rəqabət aparır.

Tərtibatçılar üçün Əsas Xüsusiyyətlər

Kontekst Sıxılması

Claude Opus 4.6-nın sıxılma xüsusiyyəti kimi, GPT-5.2-Codex tapşırıq vəziyyətini qoruyarkən əvvəlki konteksti sıxışdırır. Bu, söhbət kontekst pəncərəsini aşsa belə modelin bütün layihəni izlədiyi çoxsaatlıq kodlaşdırma sessiyalarını mümkün edir.

Uzunmüddətli Tapşırıq Tamamlama

Model bir çox addımı əhatə edən tapşırıqlar üçün optimallaşdırılıb: böyük refaktorinqlər, kod bazası miqrasiyaları və çoxfayllı funksionallıq tətbiqləri. Yanaşma uğursuz olduqda, GPT-5.2-Codex tapşırığı yenidən başlatmaq əvəzinə tənzimləyir və yenidən cəhd edir.

Daxili Zəiflik Aşkarlanması

GPT-5.2-Codex kod generasiyası zamanı zəiflik aşkarlanmasını əhatə edir. Daha dərin skan tələb edən komandalar yalançı müsbət filtrləmə ilə çoxmərhələli yoxlama təklif edən Claude Code Security kimi xüsusi alətlərdən istifadə edə bilər.

Windows Mühiti Dəstəyi

OpenAI GPT-5.2-Codex-in Windows tərtibat performansını yaxşılaşdırdı, əvvəlki modellərin Unix-mərkəzli optimallaşdırmasını həll etdi.

GPT-5.2-Codex Qiymətləri

SəviyyəMilyon Token Başına Qiymət
Giriş$1.75
Çıxış$14.00
Keşlənmiş Giriş$0.175 (90% endirim)

GPT-5.2-Codex ödənişli ChatGPT istifadəçiləri üçün bütün Codex səthləri üzrə və müstəqil API modeli olaraq mövcuddur.

GPT-5.2-Codex Agentik Kodlaşdırma üçün Nə Deməkdir

Bu buraxılış kod tamamlamadan davamlı kodlaşdırma agentlərinə sənaye miqyasında keçidi əks etdirir. OpenAI-nin Codex-i, Anthropic-in Claude Code-u və GitHub Agentic Workflows hamısı minimal insan müdaxiləsi ilə çoxaddımlı mühəndislik tapşırıqlarını hədəfləyir.

Tez-tez Verilən Suallar

GPT-5.2-Codex nədir?
GPT-5.2-Codex OpenAI-nin GPT-5.2 modelinin kodlaşdırma üçün optimallaşdırılmış variantıdır, 14 yanvar 2026-cı ildə buraxılıb. Modelin çoxaddımlı proqram mühəndisliyi sessiyaları apardığı agentik kodlaşdırma iş axınları üçün xüsusi olaraq yaradılıb. SWE-Bench Pro-da 56.4% və Terminal-Bench 2.0-da 64.0% nəticə göstərir, baza GPT-5.2 modelinin müvafiq olaraq 55.6% və 62.2% nəticələrini yaxşılaşdırır. Model 400K giriş və 128K çıxış kontekst pəncərəsini dəstəkləyir.
GPT-5.2-Codex-in qiyməti nə qədərdir?
GPT-5.2-Codex milyon giriş tokeni üçün $1.75 və milyon çıxış tokeni üçün $14 başa gəlir. Keşlənmiş girişlər 90% endirim alır, effektiv keşlənmiş dərəcəni milyon token üçün $0.175-ə endirir. Bu, onu Claude Opus 4.6-nın milyon token üçün $5/$25 qiymətindən əhəmiyyətli dərəcədə ucuz edir, lakin iki model benchmark performansı və funksionallıq dəstləri baxımından fərqlənir.
GPT-5.2-Codex-də kontekst sıxılması nədir?
Kontekst sıxılması əvvəlki söhbət kontekstini kritik tapşırıq vəziyyətini qoruyarkən sıxışdıran bir xüsusiyyətdir. Bu, GPT-5.2-Codex-ə layihə əhatəsini itirmədən çoxsaatlıq kodlaşdırma sessiyalarını davam etdirməyə imkan verir. Sessiya kontekst pəncərəsi limitinə yaxınlaşdıqda, model köhnə konteksti silmək əvəzinə ümumiləşdirir.
GPT-5.2-Codex Claude Opus 4.6 ilə necə müqayisə olunur?
Terminal-Bench 2.0-da Claude Opus 4.6 ən yüksək nəticəni saxlayır, GPT-5.2-Codex-in 64.0%-dən irəlidədir. SWE-Bench Pro-da GPT-5.2-Codex 56.4% nəticə göstərir. İki model fərqli yanaşmalar tətbiq edir: GPT-5.2-Codex daha böyük giriş konteksti (400K token, Claude-un 200K standartına qarşı) və daha aşağı qiymətlər təklif edir, Claude Opus 4.6 isə agent komandaları və mühakimə tapşırıqlarında daha yüksək benchmark nəticələri təklif edir.

Xəbərdar olun

Ən son AI xəbərlərini e-poçtunuza alın.

Paylaş