Code Velocity
نماذج الذكاء الاصطناعي

GPT-5.2-Codex: نموذج البرمجة الوكيلية من OpenAI

·6 دقائق للقراءة·OpenAI·المصدر الأصلي
مشاركة
مخطط معايير GPT-5.2-Codex يعرض نتائج SWE-Bench Pro وTerminal-Bench 2.0 مقارنة بالنموذج الأساسي GPT-5.2

نتائج معايير GPT-5.2-Codex

أصدرت OpenAI نموذج GPT-5.2-Codex في 14 يناير 2026، بعد خمسة أسابيع من النموذج الأساسي GPT-5.2. يستهدف البرمجة الوكيلية: جلسات متعددة الخطوات حيث يخطط النموذج ويكتب الكود وينفذ الاختبارات ويعالج الأخطاء.

يسجل النموذج 56.4% على SWE-Bench Pro (ارتفاعاً من 55.6% على GPT-5.2 الأساسي) و64.0% على Terminal-Bench 2.0 (ارتفاعاً من 62.2%). يختبر كلا المعيارين مهام برمجية واقعية، وليس إنشاء كود معزول.

GPT-5.2-Codex مقابل GPT-5.2 مقابل Claude Opus 4.6

المعيارGPT-5.2-CodexGPT-5.2Claude Opus 4.6
SWE-Bench Pro56.4%55.6%
Terminal-Bench 2.064.0%62.2%#1
نافذة السياق (إدخال)400K128K200K (1M تجريبي)
رموز الإخراج128K128K128K

يوازن GPT-5.2-Codex بين التكلفة والأداء. يتصدر Claude Opus 4.6 معياري Terminal-Bench 2.0 وHumanity's Last Exam، بينما ينافس GPT-5.2-Codex في السعر وحجم نافذة السياق.

الميزات الرئيسية للمطورين

ضغط السياق

مثل ميزة الضغط في Claude Opus 4.6، يضغط GPT-5.2-Codex السياق السابق مع الحفاظ على حالة المهمة. يتيح هذا جلسات برمجة متعددة الساعات حيث يتتبع النموذج المشروع بالكامل حتى عندما تتجاوز المحادثة نافذة السياق.

إنجاز المهام طويلة المدى

تم تحسين النموذج للمهام التي تمتد عبر خطوات عديدة: إعادة هيكلة كبيرة، ترحيل قواعد البيانات البرمجية، وتنفيذ ميزات متعددة الملفات. عندما يفشل منهج ما، يعدّل GPT-5.2-Codex ويعيد المحاولة بدلاً من إعادة تشغيل المهمة.

كشف الثغرات المدمج

يتضمن GPT-5.2-Codex كشف الثغرات أثناء إنشاء الكود. الفرق التي تحتاج فحصاً أعمق يمكنها استخدام أدوات مخصصة مثل Claude Code Security، الذي يوفر تحققاً متعدد المراحل مع تصفية الإيجابيات الكاذبة.

دعم بيئة Windows

حسّنت OpenAI أداء GPT-5.2-Codex على Windows، معالجةً التحسين المتمركز حول Unix في النماذج السابقة.

تسعير GPT-5.2-Codex

الفئةالتكلفة لكل مليون رمز
إدخال$1.75
إخراج$14.00
إدخال مخزن مؤقتاً$0.175 (خصم 90%)

GPT-5.2-Codex متاح عبر جميع واجهات Codex لمستخدمي ChatGPT المدفوعين وكنموذج API مستقل.

ماذا يعني GPT-5.2-Codex للبرمجة الوكيلية

يعكس هذا الإصدار تحولاً على مستوى الصناعة من إكمال الكود إلى وكلاء برمجة مستدامين. Codex من OpenAI وClaude Code من Anthropic وGitHub Agentic Workflows تستهدف جميعها مهام هندسية متعددة الخطوات بأقل تدخل بشري.

الأسئلة الشائعة

ما هو GPT-5.2-Codex؟
GPT-5.2-Codex هو إصدار محسّن للبرمجة من نموذج GPT-5.2 الخاص بـ OpenAI، صدر في 14 يناير 2026. صُمم خصيصاً لسير العمل البرمجي الوكيلي حيث يُجري النموذج جلسات هندسة برمجيات متعددة الخطوات ومستدامة. يسجل 56.4% على SWE-Bench Pro و64.0% على Terminal-Bench 2.0، متفوقاً على النموذج الأساسي GPT-5.2 الذي سجل 55.6% و62.2% على التوالي. يدعم النموذج نافذة سياق 400K للإدخال و128K للإخراج.
كم يكلف GPT-5.2-Codex؟
يكلف GPT-5.2-Codex مبلغ $1.75 لكل مليون رمز إدخال و$14 لكل مليون رمز إخراج. تحصل المدخلات المخزنة مؤقتاً على خصم 90%، مما يجعل السعر الفعلي المخزن $0.175 لكل مليون رمز. هذا أرخص بكثير من Claude Opus 4.6 بسعر $5/$25 لكل مليون رمز، رغم اختلاف النموذجين في أداء المعايير ومجموعات الميزات.
ما هو ضغط السياق في GPT-5.2-Codex؟
ضغط السياق هو ميزة تضغط السياق السابق للمحادثة مع الحفاظ على حالة المهمة الحرجة. يتيح هذا لـ GPT-5.2-Codex الحفاظ على جلسات برمجة متعددة الساعات دون فقدان نطاق المشروع. عندما تقترب الجلسة من حد نافذة السياق، يلخص النموذج السياق القديم بدلاً من حذفه، مما يمكّن من مهام برمجة أطول وأكثر تعقيداً دون إعادة تشغيل.
كيف يقارن GPT-5.2-Codex بـ Claude Opus 4.6؟
على Terminal-Bench 2.0، يحتل Claude Opus 4.6 المركز الأول متقدماً على GPT-5.2-Codex بنسبة 64.0%. على SWE-Bench Pro، يسجل GPT-5.2-Codex نسبة 56.4%. يتبع النموذجان منهجين مختلفين: يوفر GPT-5.2-Codex سياق إدخال أكبر (400K رمز مقابل 200K لـ Claude) وتسعيراً أقل، بينما يوفر Claude Opus 4.6 فرق وكلاء ونتائج معايير أعلى في مهام الاستدلال مثل Humanity's Last Exam.

ابقَ على اطلاع

احصل على آخر أخبار الذكاء الاصطناعي في بريدك.

مشاركة