نتائج معايير Gemini 3.1 Pro
أصدرت Google DeepMind نموذج Gemini 3.1 Pro في 19 فبراير 2026. النموذج ضاعف أداء الاستدلال لسلفه بأكثر من الضعف، مسجلاً 77.1% على ARC-AGI-2 مقابل Gemini 3 Pro.
يستهدف Gemini 3.1 Pro المهام التي تتطلب استدلالاً متعدد الخطوات: تصميم الخوارزميات، تجميع البيانات واسع النطاق، سير العمل الوكيلي، والبرمجة المعقدة.
Gemini 3.1 Pro مقابل Claude Opus 4.6 مقابل GPT-5.2
| المعيار | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77.1% | — | — |
| RE-Bench (بحث وتطوير ML) | 1.27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64.0% |
| Humanity's Last Exam | — | #1 | — |
| السياق (إدخال) | 1M | 200K (1M تجريبي) | 400K |
| السياق (إخراج) | 64K | 128K | 128K |
كل نموذج يتصدر في مجالات مختلفة. Gemini 3.1 Pro يتصدر معايير الاستدلال الجديدة. Claude Opus 4.6 يتصدر البرمجة الوكيلية والاستدلال متعدد التخصصات. GPT-5.2-Codex يوفر أداء برمجة تنافسي بأسعار أقل.
الميزات الرئيسية للمطورين
عمق تفكير قابل للتكوين
يقدم Gemini 3.1 Pro معامل thinking_level للتحكم في عمق الاستدلال. التفكير المنخفض سريع ورخيص للمهام الروتينية. التفكير العالي يطبق حساباً أكثر على المشاكل المعقدة.
هذا مماثل لأدوات تحكم الجهد في Claude Opus 4.6، رغم أن Gemini يكشف الإعداد كمعامل API صريح بدلاً من سلوك نموذج تكيفي.
نقطة نهاية الأدوات المخصصة
نقطة نهاية منفصلة، gemini-3.1-pro-preview-customtools، محسّنة للتطبيقات الوكيلية التي تجمع بين أوامر الصدفة والأدوات المخصصة. تعطي الأولوية لاختيار الأداة الصحيح واستدعائها، مما يقلل الأخطاء عندما تتفاعل الوكلاء مع أنظمة خارجية. هذا مهم للمطورين الذين يبنون وكلاء مماثلة لـ GitHub Agentic Workflows، حيث تؤثر دقة اختيار الأداة مباشرة على موثوقية الأتمتة.
إدخال روابط YouTube
يمكن للمطورين تمرير روابط YouTube مباشرة في الأوامر. يحلل النموذج محتوى الفيديو، مما يمكّن من سير عمل يجمع بين فهم الفيديو وإنشاء الكود أو المستندات.
المعالجة متعددة الوسائط
يتعامل Gemini 3.1 Pro مع النص والصور والصوت والفيديو والكود في سياق واحد. بنافذة إدخال 1M رمز، يمكنه معالجة قواعد بيانات برمجية كاملة أو مستندات بحثية طويلة في مرة واحدة.
RE-Bench: أداء أبحاث التعلم الآلي
على RE-Bench، الذي يقيّم قدرات البحث والتطوير في التعلم الآلي، سجل Gemini 3.1 Pro نتيجة 1.27 (طبيعي بشرياً)، ارتفاعاً من 1.04 لـ Gemini 3 Pro. أكمل النموذج مهام التحسين في 47 ثانية مقابل المرجع البشري البالغ 94 ثانية.
توفر Gemini 3.1 Pro
Gemini 3.1 Pro متاح في تطبيق Gemini وGoogle Cloud Vertex AI وGoogle AI Studio وGemini API. يختلف التسعير حسب المنصة. النموذج في مرحلة المعاينة؛ التوفر العام متوقع لاحقاً.
الأسئلة الشائعة
ما هو Gemini 3.1 Pro؟
كيف يقارن Gemini 3.1 Pro بـ Claude Opus 4.6؟
ما هو معامل thinking_level في Gemini 3.1 Pro؟
ما هي نقطة نهاية الأدوات المخصصة في Gemini 3.1 Pro؟
ابقَ على اطلاع
احصل على آخر أخبار الذكاء الاصطناعي في بريدك.
