GPT-5.2-Codex बेंचमार्क परिणाम
OpenAI ने 14 जनवरी 2026 को GPT-5.2-Codex रिलीज़ किया, बेस GPT-5.2 मॉडल के पाँच सप्ताह बाद। यह एजेंटिक कोडिंग को लक्षित करता है: मल्टी-स्टेप सेशन जहाँ मॉडल योजना बनाता है, कोड लिखता है, टेस्ट चलाता है और विफलताओं पर पुनरावृत्ति करता है।
मॉडल ने SWE-Bench Pro पर 56.4% (बेस GPT-5.2 के 55.6% से ऊपर) और Terminal-Bench 2.0 पर 64.0% (62.2% से ऊपर) स्कोर किया। दोनों बेंचमार्क वास्तविक कोडिंग कार्यों का परीक्षण करते हैं, अलग-थलग कोड जनरेशन का नहीं।
GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6
| बेंचमार्क | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | 56.4% | 55.6% | — |
| Terminal-Bench 2.0 | 64.0% | 62.2% | #1 |
| कॉन्टेक्स्ट विंडो (इनपुट) | 400K | 128K | 200K (1M बीटा) |
| आउटपुट टोकन | 128K | 128K | 128K |
GPT-5.2-Codex लागत और प्रदर्शन में संतुलन बनाता है। Claude Opus 4.6 Terminal-Bench 2.0 और Humanity's Last Exam में अग्रणी है, जबकि GPT-5.2-Codex कीमत और कॉन्टेक्स्ट विंडो साइज़ में प्रतिस्पर्धा करता है।
डेवलपर्स के लिए प्रमुख फीचर्स
Context Compaction
Claude Opus 4.6 की compaction सुविधा की तरह, GPT-5.2-Codex टास्क स्टेट को बनाए रखते हुए पुराने कॉन्टेक्स्ट को कम्प्रेस करता है। इससे मल्टी-ऑवर कोडिंग सेशन संभव होते हैं जहाँ मॉडल पूरे प्रोजेक्ट को ट्रैक करता है भले ही कॉन्वर्सेशन कॉन्टेक्स्ट विंडो से आगे बढ़ जाए।
लॉन्ग-होराइज़न टास्क कंप्लीशन
मॉडल कई स्टेप्स में फैले कार्यों के लिए ऑप्टिमाइज़्ड है: बड़े रिफैक्टर्स, कोडबेस माइग्रेशन, और मल्टी-फ़ाइल फीचर इम्प्लीमेंटेशन। जब कोई दृष्टिकोण विफल होता है, तो GPT-5.2-Codex टास्क को रीस्टार्ट करने की बजाय एडजस्ट करता है और फिर से प्रयास करता है।
बिल्ट-इन वल्नरेबिलिटी डिटेक्शन
GPT-5.2-Codex कोड जनरेशन के दौरान वल्नरेबिलिटी डिटेक्शन शामिल करता है। गहरी स्कैनिंग की ज़रूरत वाली टीमें Claude Code Security जैसे समर्पित टूल्स का उपयोग कर सकती हैं, जो false positive फ़िल्टरिंग के साथ मल्टी-स्टेज वेरिफ़िकेशन प्रदान करता है।
Windows वातावरण सहायता
OpenAI ने GPT-5.2-Codex के Windows डेवलपमेंट प्रदर्शन में सुधार किया, पुराने मॉडलों के Unix-केंद्रित ऑप्टिमाइज़ेशन को संबोधित करते हुए।
GPT-5.2-Codex मूल्य निर्धारण
| टियर | प्रति मिलियन टोकन लागत |
|---|---|
| इनपुट | $1.75 |
| आउटपुट | $14.00 |
| कैश्ड इनपुट | $0.175 (90% छूट) |
GPT-5.2-Codex सभी Codex सरफेस पर पेड ChatGPT यूज़र्स और स्टैंडअलोन API मॉडल के रूप में उपलब्ध है।
एजेंटिक कोडिंग के लिए GPT-5.2-Codex का क्या मतलब है
यह रिलीज़ कोड कंप्लीशन से निरंतर कोडिंग एजेंट्स की ओर एक उद्योग-व्यापी बदलाव को दर्शाती है। OpenAI का Codex, Anthropic का Claude Code, और GitHub Agentic Workflows सभी न्यूनतम मानवीय हस्तक्षेप के साथ मल्टी-स्टेप इंजीनियरिंग कार्यों को लक्षित करते हैं।
अक्सर पूछे जाने वाले प्रश्न
GPT-5.2-Codex क्या है?
GPT-5.2-Codex की कीमत क्या है?
GPT-5.2-Codex में context compaction क्या है?
GPT-5.2-Codex की तुलना Claude Opus 4.6 से कैसे है?
अपडेट रहें
नवीनतम AI समाचार अपने इनबॉक्स में पाएं।
