Code Velocity
AI मॉडल

GPT-5.2-Codex: OpenAI का एजेंटिक कोडिंग मॉडल

·6 मिनट पढ़ें·OpenAI·मूल स्रोत
शेयर करें
GPT-5.2-Codex बेंचमार्क चार्ट जो SWE-Bench Pro और Terminal-Bench 2.0 स्कोर को GPT-5.2 बेस मॉडल से तुलना करता है

GPT-5.2-Codex बेंचमार्क परिणाम

OpenAI ने 14 जनवरी 2026 को GPT-5.2-Codex रिलीज़ किया, बेस GPT-5.2 मॉडल के पाँच सप्ताह बाद। यह एजेंटिक कोडिंग को लक्षित करता है: मल्टी-स्टेप सेशन जहाँ मॉडल योजना बनाता है, कोड लिखता है, टेस्ट चलाता है और विफलताओं पर पुनरावृत्ति करता है।

मॉडल ने SWE-Bench Pro पर 56.4% (बेस GPT-5.2 के 55.6% से ऊपर) और Terminal-Bench 2.0 पर 64.0% (62.2% से ऊपर) स्कोर किया। दोनों बेंचमार्क वास्तविक कोडिंग कार्यों का परीक्षण करते हैं, अलग-थलग कोड जनरेशन का नहीं।

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

बेंचमार्कGPT-5.2-CodexGPT-5.2Claude Opus 4.6
SWE-Bench Pro56.4%55.6%
Terminal-Bench 2.064.0%62.2%#1
कॉन्टेक्स्ट विंडो (इनपुट)400K128K200K (1M बीटा)
आउटपुट टोकन128K128K128K

GPT-5.2-Codex लागत और प्रदर्शन में संतुलन बनाता है। Claude Opus 4.6 Terminal-Bench 2.0 और Humanity's Last Exam में अग्रणी है, जबकि GPT-5.2-Codex कीमत और कॉन्टेक्स्ट विंडो साइज़ में प्रतिस्पर्धा करता है।

डेवलपर्स के लिए प्रमुख फीचर्स

Context Compaction

Claude Opus 4.6 की compaction सुविधा की तरह, GPT-5.2-Codex टास्क स्टेट को बनाए रखते हुए पुराने कॉन्टेक्स्ट को कम्प्रेस करता है। इससे मल्टी-ऑवर कोडिंग सेशन संभव होते हैं जहाँ मॉडल पूरे प्रोजेक्ट को ट्रैक करता है भले ही कॉन्वर्सेशन कॉन्टेक्स्ट विंडो से आगे बढ़ जाए।

लॉन्ग-होराइज़न टास्क कंप्लीशन

मॉडल कई स्टेप्स में फैले कार्यों के लिए ऑप्टिमाइज़्ड है: बड़े रिफैक्टर्स, कोडबेस माइग्रेशन, और मल्टी-फ़ाइल फीचर इम्प्लीमेंटेशन। जब कोई दृष्टिकोण विफल होता है, तो GPT-5.2-Codex टास्क को रीस्टार्ट करने की बजाय एडजस्ट करता है और फिर से प्रयास करता है।

बिल्ट-इन वल्नरेबिलिटी डिटेक्शन

GPT-5.2-Codex कोड जनरेशन के दौरान वल्नरेबिलिटी डिटेक्शन शामिल करता है। गहरी स्कैनिंग की ज़रूरत वाली टीमें Claude Code Security जैसे समर्पित टूल्स का उपयोग कर सकती हैं, जो false positive फ़िल्टरिंग के साथ मल्टी-स्टेज वेरिफ़िकेशन प्रदान करता है।

Windows वातावरण सहायता

OpenAI ने GPT-5.2-Codex के Windows डेवलपमेंट प्रदर्शन में सुधार किया, पुराने मॉडलों के Unix-केंद्रित ऑप्टिमाइज़ेशन को संबोधित करते हुए।

GPT-5.2-Codex मूल्य निर्धारण

टियरप्रति मिलियन टोकन लागत
इनपुट$1.75
आउटपुट$14.00
कैश्ड इनपुट$0.175 (90% छूट)

GPT-5.2-Codex सभी Codex सरफेस पर पेड ChatGPT यूज़र्स और स्टैंडअलोन API मॉडल के रूप में उपलब्ध है।

एजेंटिक कोडिंग के लिए GPT-5.2-Codex का क्या मतलब है

यह रिलीज़ कोड कंप्लीशन से निरंतर कोडिंग एजेंट्स की ओर एक उद्योग-व्यापी बदलाव को दर्शाती है। OpenAI का Codex, Anthropic का Claude Code, और GitHub Agentic Workflows सभी न्यूनतम मानवीय हस्तक्षेप के साथ मल्टी-स्टेप इंजीनियरिंग कार्यों को लक्षित करते हैं।

अक्सर पूछे जाने वाले प्रश्न

GPT-5.2-Codex क्या है?
GPT-5.2-Codex, OpenAI के GPT-5.2 मॉडल का कोडिंग-ऑप्टिमाइज़्ड वेरिएंट है, जो 14 जनवरी 2026 को रिलीज़ हुआ। यह विशेष रूप से एजेंटिक कोडिंग वर्कफ़्लो के लिए बनाया गया है जहाँ मॉडल निरंतर, मल्टी-स्टेप सॉफ़्टवेयर इंजीनियरिंग सेशन चलाता है। इसने SWE-Bench Pro पर 56.4% और Terminal-Bench 2.0 पर 64.0% स्कोर किया, जो बेस GPT-5.2 मॉडल के क्रमशः 55.6% और 62.2% से बेहतर है। मॉडल 400K इनपुट और 128K आउटपुट कॉन्टेक्स्ट विंडो सपोर्ट करता है।
GPT-5.2-Codex की कीमत क्या है?
GPT-5.2-Codex की कीमत $1.75 प्रति मिलियन इनपुट टोकन और $14 प्रति मिलियन आउटपुट टोकन है। कैश्ड इनपुट पर 90% की छूट मिलती है, जिससे प्रभावी कैश्ड दर $0.175 प्रति मिलियन टोकन हो जाती है। यह Claude Opus 4.6 ($5/$25 प्रति मिलियन टोकन) से काफी सस्ता है, हालाँकि दोनों मॉडल बेंचमार्क प्रदर्शन और फीचर सेट में भिन्न हैं।
GPT-5.2-Codex में context compaction क्या है?
Context compaction एक ऐसी सुविधा है जो महत्वपूर्ण टास्क स्टेट को बनाए रखते हुए पुराने कॉन्वर्सेशन कॉन्टेक्स्ट को कम्प्रेस करती है। इससे GPT-5.2-Codex कई घंटों के कोडिंग सेशन को प्रोजेक्ट स्कोप का ट्रैक खोए बिना जारी रख सकता है। जब सेशन कॉन्टेक्स्ट विंडो की सीमा के करीब पहुँचता है, तो मॉडल पुराने कॉन्टेक्स्ट को ड्रॉप करने की बजाय सारांशित करता है।
GPT-5.2-Codex की तुलना Claude Opus 4.6 से कैसे है?
Terminal-Bench 2.0 पर Claude Opus 4.6 सबसे ऊपर है, GPT-5.2-Codex के 64.0% से आगे। SWE-Bench Pro पर GPT-5.2-Codex ने 56.4% स्कोर किया। दोनों मॉडल अलग-अलग दृष्टिकोण अपनाते हैं: GPT-5.2-Codex बड़ा इनपुट कॉन्टेक्स्ट (400K टोकन बनाम Claude के 200K) और कम कीमत प्रदान करता है, जबकि Claude Opus 4.6 agent teams और Humanity's Last Exam जैसे रीज़निंग टास्क पर उच्च बेंचमार्क स्कोर प्रदान करता है।

अपडेट रहें

नवीनतम AI समाचार अपने इनबॉक्स में पाएं।

शेयर करें