Code Velocity
نماذج الذكاء الاصطناعي

Gemini 3.1 Pro: نموذج Google القائم على الاستدلال

·6 دقائق للقراءة·Google, Google DeepMind·المصدر الأصلي
مشاركة
مقارنة معايير Gemini 3.1 Pro تعرض نتائج ARC-AGI-2 وRE-Bench مقابل Gemini 3 Pro ونماذج حدودية أخرى

نتائج معايير Gemini 3.1 Pro

أصدرت Google DeepMind نموذج Gemini 3.1 Pro في 19 فبراير 2026. النموذج ضاعف أداء الاستدلال لسلفه بأكثر من الضعف، مسجلاً 77.1% على ARC-AGI-2 مقابل Gemini 3 Pro.

يستهدف Gemini 3.1 Pro المهام التي تتطلب استدلالاً متعدد الخطوات: تصميم الخوارزميات، تجميع البيانات واسع النطاق، سير العمل الوكيلي، والبرمجة المعقدة.

Gemini 3.1 Pro مقابل Claude Opus 4.6 مقابل GPT-5.2

المعيارGemini 3.1 ProClaude Opus 4.6GPT-5.2-Codex
ARC-AGI-277.1%
RE-Bench (بحث وتطوير ML)1.27
Terminal-Bench 2.0#164.0%
Humanity's Last Exam#1
السياق (إدخال)1M200K (1M تجريبي)400K
السياق (إخراج)64K128K128K

كل نموذج يتصدر في مجالات مختلفة. Gemini 3.1 Pro يتصدر معايير الاستدلال الجديدة. Claude Opus 4.6 يتصدر البرمجة الوكيلية والاستدلال متعدد التخصصات. GPT-5.2-Codex يوفر أداء برمجة تنافسي بأسعار أقل.

الميزات الرئيسية للمطورين

عمق تفكير قابل للتكوين

يقدم Gemini 3.1 Pro معامل thinking_level للتحكم في عمق الاستدلال. التفكير المنخفض سريع ورخيص للمهام الروتينية. التفكير العالي يطبق حساباً أكثر على المشاكل المعقدة.

هذا مماثل لأدوات تحكم الجهد في Claude Opus 4.6، رغم أن Gemini يكشف الإعداد كمعامل API صريح بدلاً من سلوك نموذج تكيفي.

نقطة نهاية الأدوات المخصصة

نقطة نهاية منفصلة، gemini-3.1-pro-preview-customtools، محسّنة للتطبيقات الوكيلية التي تجمع بين أوامر الصدفة والأدوات المخصصة. تعطي الأولوية لاختيار الأداة الصحيح واستدعائها، مما يقلل الأخطاء عندما تتفاعل الوكلاء مع أنظمة خارجية. هذا مهم للمطورين الذين يبنون وكلاء مماثلة لـ GitHub Agentic Workflows، حيث تؤثر دقة اختيار الأداة مباشرة على موثوقية الأتمتة.

إدخال روابط YouTube

يمكن للمطورين تمرير روابط YouTube مباشرة في الأوامر. يحلل النموذج محتوى الفيديو، مما يمكّن من سير عمل يجمع بين فهم الفيديو وإنشاء الكود أو المستندات.

المعالجة متعددة الوسائط

يتعامل Gemini 3.1 Pro مع النص والصور والصوت والفيديو والكود في سياق واحد. بنافذة إدخال 1M رمز، يمكنه معالجة قواعد بيانات برمجية كاملة أو مستندات بحثية طويلة في مرة واحدة.

RE-Bench: أداء أبحاث التعلم الآلي

على RE-Bench، الذي يقيّم قدرات البحث والتطوير في التعلم الآلي، سجل Gemini 3.1 Pro نتيجة 1.27 (طبيعي بشرياً)، ارتفاعاً من 1.04 لـ Gemini 3 Pro. أكمل النموذج مهام التحسين في 47 ثانية مقابل المرجع البشري البالغ 94 ثانية.

توفر Gemini 3.1 Pro

Gemini 3.1 Pro متاح في تطبيق Gemini وGoogle Cloud Vertex AI وGoogle AI Studio وGemini API. يختلف التسعير حسب المنصة. النموذج في مرحلة المعاينة؛ التوفر العام متوقع لاحقاً.

الأسئلة الشائعة

ما هو Gemini 3.1 Pro؟
Gemini 3.1 Pro هو ترقية محسّنة للاستدلال من Google DeepMind لسلسلة Gemini 3، صدر في 19 فبراير 2026. يسجل 77.1% على ARC-AGI-2، أكثر من ضعف أداء استدلال Gemini 3 Pro. يدعم النموذج سياق إدخال 1M رمز و64K رمز إخراج، ويقدم معامل thinking_level يتيح للمطورين التحكم في عمق تفكير النموذج قبل الاستجابة.
كيف يقارن Gemini 3.1 Pro بـ Claude Opus 4.6؟
يستهدف Gemini 3.1 Pro وClaude Opus 4.6 نقاط قوة مختلفة. يتصدر Gemini 3.1 Pro في ARC-AGI-2 (77.1%) وRE-Bench للبحث والتطوير في التعلم الآلي، بينما يحتل Claude Opus 4.6 المركز الأول على Terminal-Bench 2.0 للبرمجة الوكيلية وHumanity's Last Exam للاستدلال متعدد التخصصات. كلاهما يوفر نوافذ سياق 1M رمز. يعتمد الاختيار على عبء العمل: Gemini يتفوق في مهام الاستدلال الجديدة، Claude في العمل البرمجي المستدام.
ما هو معامل thinking_level في Gemini 3.1 Pro؟
معامل thinking_level يتيح للمطورين التحكم في أقصى عمق استدلال يطبقه النموذج قبل إنتاج استجابة. التفكير المنخفض أسرع وأرخص للمهام المباشرة. التفكير العالي يخصص وقت حساب أكثر لمشاكل الاستدلال المعقدة. يمنح هذا المطورين تحكماً صريحاً في مفاضلة التكلفة-السرعة-الجودة، مماثلاً لأدوات التحكم في الجهد في Claude Opus 4.6.
ما هي نقطة نهاية الأدوات المخصصة في Gemini 3.1 Pro؟
يتضمن Gemini 3.1 Pro نقطة نهاية API منفصلة تسمى gemini-3.1-pro-preview-customtools، محسّنة لإعطاء الأولوية لأدوات المطورين المخصصة. عند بناء تطبيقات وكيلية بمزيج من أوامر bash والأدوات المخصصة، تضمن نقطة النهاية هذه أن النموذج يختار ويستدعي الأداة الصحيحة بدقة. هذا مفيد بشكل خاص للمطورين الذين يبنون وكلاء ذكاء اصطناعي تحتاج للتفاعل مع أنظمة وواجهات برمجية خارجية.

ابقَ على اطلاع

احصل على آخر أخبار الذكاء الاصطناعي في بريدك.

مشاركة