GPT-5.2-Codex: OpenAI का एजेंटिक कोडिंग मॉडल

GPT-5.2-Codex बेंचमार्क परिणाम

OpenAI ने 14 जनवरी 2026 को GPT-5.2-Codex रिलीज़ किया, बेस GPT-5.2 मॉडल के पाँच सप्ताह बाद। यह एजेंटिक कोडिंग को लक्षित करता है: मल्टी-स्टेप सेशन जहाँ मॉडल योजना बनाता है, कोड लिखता है, टेस्ट चलाता है और विफलताओं पर पुनरावृत्ति करता है।

मॉडल ने SWE-Bench Pro पर 56.4% (बेस GPT-5.2 के 55.6% से ऊपर) और Terminal-Bench 2.0 पर 64.0% (62.2% से ऊपर) स्कोर किया। दोनों बेंचमार्क वास्तविक कोडिंग कार्यों का परीक्षण करते हैं, अलग-थलग कोड जनरेशन का नहीं।

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

बेंचमार्क	GPT-5.2-Codex	GPT-5.2	Claude Opus 4.6
SWE-Bench Pro	56.4%	55.6%	—
Terminal-Bench 2.0	64.0%	62.2%	#1
कॉन्टेक्स्ट विंडो (इनपुट)	400K	128K	200K (1M बीटा)
आउटपुट टोकन	128K	128K	128K

GPT-5.2-Codex लागत और प्रदर्शन में संतुलन बनाता है। Claude Opus 4.6 Terminal-Bench 2.0 और Humanity's Last Exam में अग्रणी है, जबकि GPT-5.2-Codex कीमत और कॉन्टेक्स्ट विंडो साइज़ में प्रतिस्पर्धा करता है।

डेवलपर्स के लिए प्रमुख फीचर्स

Context Compaction

Claude Opus 4.6 की compaction सुविधा की तरह, GPT-5.2-Codex टास्क स्टेट को बनाए रखते हुए पुराने कॉन्टेक्स्ट को कम्प्रेस करता है। इससे मल्टी-ऑवर कोडिंग सेशन संभव होते हैं जहाँ मॉडल पूरे प्रोजेक्ट को ट्रैक करता है भले ही कॉन्वर्सेशन कॉन्टेक्स्ट विंडो से आगे बढ़ जाए।

लॉन्ग-होराइज़न टास्क कंप्लीशन

मॉडल कई स्टेप्स में फैले कार्यों के लिए ऑप्टिमाइज़्ड है: बड़े रिफैक्टर्स, कोडबेस माइग्रेशन, और मल्टी-फ़ाइल फीचर इम्प्लीमेंटेशन। जब कोई दृष्टिकोण विफल होता है, तो GPT-5.2-Codex टास्क को रीस्टार्ट करने की बजाय एडजस्ट करता है और फिर से प्रयास करता है।

बिल्ट-इन वल्नरेबिलिटी डिटेक्शन

GPT-5.2-Codex कोड जनरेशन के दौरान वल्नरेबिलिटी डिटेक्शन शामिल करता है। गहरी स्कैनिंग की ज़रूरत वाली टीमें Claude Code Security जैसे समर्पित टूल्स का उपयोग कर सकती हैं, जो false positive फ़िल्टरिंग के साथ मल्टी-स्टेज वेरिफ़िकेशन प्रदान करता है।

Windows वातावरण सहायता

OpenAI ने GPT-5.2-Codex के Windows डेवलपमेंट प्रदर्शन में सुधार किया, पुराने मॉडलों के Unix-केंद्रित ऑप्टिमाइज़ेशन को संबोधित करते हुए।

GPT-5.2-Codex मूल्य निर्धारण

टियर	प्रति मिलियन टोकन लागत
इनपुट	$1.75
आउटपुट	$14.00
कैश्ड इनपुट	$0.175 (90% छूट)

GPT-5.2-Codex सभी Codex सरफेस पर पेड ChatGPT यूज़र्स और स्टैंडअलोन API मॉडल के रूप में उपलब्ध है।

एजेंटिक कोडिंग के लिए GPT-5.2-Codex का क्या मतलब है

यह रिलीज़ कोड कंप्लीशन से निरंतर कोडिंग एजेंट्स की ओर एक उद्योग-व्यापी बदलाव को दर्शाती है। OpenAI का Codex, Anthropic का Claude Code, और GitHub Agentic Workflows सभी न्यूनतम मानवीय हस्तक्षेप के साथ मल्टी-स्टेप इंजीनियरिंग कार्यों को लक्षित करते हैं।

अक्सर पूछे जाने वाले प्रश्न

GPT-5.2-Codex क्या है?

GPT-5.2-Codex, OpenAI के GPT-5.2 मॉडल का कोडिंग-ऑप्टिमाइज़्ड वेरिएंट है, जो 14 जनवरी 2026 को रिलीज़ हुआ। यह विशेष रूप से एजेंटिक कोडिंग वर्कफ़्लो के लिए बनाया गया है जहाँ मॉडल निरंतर, मल्टी-स्टेप सॉफ़्टवेयर इंजीनियरिंग सेशन चलाता है। इसने SWE-Bench Pro पर 56.4% और Terminal-Bench 2.0 पर 64.0% स्कोर किया, जो बेस GPT-5.2 मॉडल के क्रमशः 55.6% और 62.2% से बेहतर है। मॉडल 400K इनपुट और 128K आउटपुट कॉन्टेक्स्ट विंडो सपोर्ट करता है।

GPT-5.2-Codex की कीमत क्या है?

GPT-5.2-Codex की कीमत $1.75 प्रति मिलियन इनपुट टोकन और $14 प्रति मिलियन आउटपुट टोकन है। कैश्ड इनपुट पर 90% की छूट मिलती है, जिससे प्रभावी कैश्ड दर $0.175 प्रति मिलियन टोकन हो जाती है। यह Claude Opus 4.6 ($5/$25 प्रति मिलियन टोकन) से काफी सस्ता है, हालाँकि दोनों मॉडल बेंचमार्क प्रदर्शन और फीचर सेट में भिन्न हैं।

GPT-5.2-Codex में context compaction क्या है?

Context compaction एक ऐसी सुविधा है जो महत्वपूर्ण टास्क स्टेट को बनाए रखते हुए पुराने कॉन्वर्सेशन कॉन्टेक्स्ट को कम्प्रेस करती है। इससे GPT-5.2-Codex कई घंटों के कोडिंग सेशन को प्रोजेक्ट स्कोप का ट्रैक खोए बिना जारी रख सकता है। जब सेशन कॉन्टेक्स्ट विंडो की सीमा के करीब पहुँचता है, तो मॉडल पुराने कॉन्टेक्स्ट को ड्रॉप करने की बजाय सारांशित करता है।

GPT-5.2-Codex की तुलना Claude Opus 4.6 से कैसे है?

Terminal-Bench 2.0 पर Claude Opus 4.6 सबसे ऊपर है, GPT-5.2-Codex के 64.0% से आगे। SWE-Bench Pro पर GPT-5.2-Codex ने 56.4% स्कोर किया। दोनों मॉडल अलग-अलग दृष्टिकोण अपनाते हैं: GPT-5.2-Codex बड़ा इनपुट कॉन्टेक्स्ट (400K टोकन बनाम Claude के 200K) और कम कीमत प्रदान करता है, जबकि Claude Opus 4.6 agent teams और Humanity's Last Exam जैसे रीज़निंग टास्क पर उच्च बेंचमार्क स्कोर प्रदान करता है।