GPT-5.2-Codex بینچ مارک نتائج
OpenAI نے GPT-5.2-Codex کو 14 جنوری 2026 کو جاری کیا، بنیادی GPT-5.2 ماڈل کے پانچ ہفتے بعد۔ یہ ایجنٹک کوڈنگ کو نشانہ بناتا ہے: کئی مراحل پر مشتمل سیشنز جہاں ماڈل منصوبہ بندی کرتا ہے، کوڈ لکھتا ہے، ٹیسٹ چلاتا ہے، اور ناکامیوں پر دوبارہ کوشش کرتا ہے۔
ماڈل SWE-Bench Pro پر 56.4% (بنیادی GPT-5.2 کے 55.6% سے اوپر) اور Terminal-Bench 2.0 پر 64.0% (62.2% سے اوپر) اسکور کرتا ہے۔ دونوں بینچ مارکس حقیقی دنیا کے کوڈنگ ٹاسکس کا تجربہ کرتے ہیں، الگ تھلگ کوڈ تخلیق کا نہیں۔
GPT-5.2-Codex بمقابلہ GPT-5.2 بمقابلہ Claude Opus 4.6
| بینچ مارک | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | 56.4% | 55.6% | — |
| Terminal-Bench 2.0 | 64.0% | 62.2% | #1 |
| سیاق و سباق ونڈو (ان پٹ) | 400K | 128K | 200K (1M بیٹا) |
| آؤٹ پٹ ٹوکنز | 128K | 128K | 128K |
GPT-5.2-Codex لاگت اور کارکردگی میں توازن رکھتا ہے۔ Claude Opus 4.6 Terminal-Bench 2.0 اور Humanity's Last Exam میں سرفہرست ہے، جبکہ GPT-5.2-Codex قیمت اور سیاق و سباق ونڈو کے سائز میں مقابلہ کرتا ہے۔
ڈیولپرز کے لیے اہم خصوصیات
سیاق و سباق کی تکثیف
Claude Opus 4.6 کی تکثیف خصوصیت کی طرح، GPT-5.2-Codex ٹاسک اسٹیٹ کو محفوظ رکھتے ہوئے پرانے سیاق و سباق کو دبا دیتا ہے۔ یہ کئی گھنٹوں کے کوڈنگ سیشنز کو ممکن بناتا ہے جہاں ماڈل پوری پراجیکٹ کو ٹریک کرتا ہے چاہے گفتگو سیاق و سباق ونڈو سے تجاوز کر جائے۔
طویل المدت ٹاسک تکمیل
ماڈل کئی مراحل پر مشتمل کاموں کے لیے بہتر بنایا گیا ہے: بڑی ری فیکٹرنگ، کوڈ بیس منتقلی، اور کئی فائلوں کی فیچر نفاذ۔ جب کوئی نقطہ نظر ناکام ہوتا ہے تو GPT-5.2-Codex ٹاسک دوبارہ شروع کرنے کی بجائے ایڈجسٹ کرتا ہے اور دوبارہ کوشش کرتا ہے۔
بلٹ ان خطرات کی نشاندہی
GPT-5.2-Codex کوڈ تخلیق کے دوران خطرات کی نشاندہی شامل کرتا ہے۔ گہری اسکیننگ کی ضرورت والی ٹیمیں Claude Code Security جیسے مخصوص ٹولز استعمال کر سکتی ہیں، جو فالس پازیٹو فلٹرنگ کے ساتھ کثیر مرحلہ تصدیق پیش کرتا ہے۔
Windows ماحول کی حمایت
OpenAI نے GPT-5.2-Codex کی Windows ترقیاتی کارکردگی کو بہتر بنایا، پچھلے ماڈلز کی Unix مرکوز اصلاح کو حل کیا۔
GPT-5.2-Codex قیمت
| درجہ | فی ملین ٹوکنز لاگت |
|---|---|
| ان پٹ | $1.75 |
| آؤٹ پٹ | $14.00 |
| کیشڈ ان پٹ | $0.175 (90% رعایت) |
GPT-5.2-Codex ادائیگی کرنے والے ChatGPT صارفین کے لیے تمام Codex پلیٹ فارمز پر اور بطور مستقل API ماڈل دستیاب ہے۔
ایجنٹک کوڈنگ کے لیے GPT-5.2-Codex کا کیا مطلب ہے
یہ ریلیز کوڈ تکمیل سے مستقل کوڈنگ ایجنٹس کی طرف صنعت بھر کی تبدیلی کی عکاسی کرتی ہے۔ OpenAI کا Codex، Anthropic کا Claude Code، اور GitHub Agentic Workflows سب کم سے کم انسانی مداخلت کے ساتھ کئی مراحل کے انجینئرنگ ٹاسکس کو نشانہ بناتے ہیں۔
اکثر پوچھے جانے والے سوالات
GPT-5.2-Codex کیا ہے؟
GPT-5.2-Codex کی قیمت کتنی ہے؟
GPT-5.2-Codex میں سیاق و سباق کی تکثیف کیا ہے؟
GPT-5.2-Codex کا Claude Opus 4.6 سے کیا موازنہ ہے؟
اپ ڈیٹ رہیں
تازہ ترین AI خبریں اپنے ان باکس میں حاصل کریں۔
