Gemini 3.1 Pro بینچ مارک نتائج
Google DeepMind نے 19 فروری 2026 کو Gemini 3.1 Pro جاری کیا۔ ماڈل اپنے پیشرو کی استدلال کارکردگی سے دوگنا سے زیادہ بہتری لاتا ہے، Gemini 3 Pro کے مقابلے ARC-AGI-2 پر 77.1% اسکور کرتا ہے۔
Gemini 3.1 Pro کثیر مرحلہ استدلال کی ضرورت والے کاموں کو نشانہ بناتا ہے: الگورتھم ڈیزائن، بڑے پیمانے پر ڈیٹا ترکیب، ایجنٹک ورک فلوز، اور پیچیدہ کوڈنگ۔
Gemini 3.1 Pro بمقابلہ Claude Opus 4.6 بمقابلہ GPT-5.2
| بینچ مارک | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77.1% | — | — |
| RE-Bench (ML R&D) | 1.27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64.0% |
| Humanity's Last Exam | — | #1 | — |
| سیاق و سباق (ان پٹ) | 1M | 200K (1M بیٹا) | 400K |
| سیاق و سباق (آؤٹ پٹ) | 64K | 128K | 128K |
ہر ماڈل مختلف شعبوں میں سرفہرست ہے۔ Gemini 3.1 Pro نئے استدلال بینچ مارکس میں اول۔ Claude Opus 4.6 ایجنٹک کوڈنگ اور کثیر الشعبہ استدلال میں سرفہرست۔ GPT-5.2-Codex کم قیمت پر مسابقتی کوڈنگ کارکردگی پیش کرتا ہے۔
ڈیولپرز کے لیے اہم خصوصیات
قابل ترتیب سوچ کی گہرائی
Gemini 3.1 Pro استدلال کی گہرائی کنٹرول کرنے والا thinking_level پیرامیٹر متعارف کراتا ہے۔ کم سوچ معمول کے کاموں کے لیے تیز اور سستی ہے۔ زیادہ سوچ پیچیدہ مسائل کے لیے زیادہ حساب لاگو کرتی ہے۔
یہ Claude Opus 4.6 کے کوشش کنٹرولز سے ملتا جلتا ہے، اگرچہ Gemini سیٹنگ کو موافق ماڈل رویے کی بجائے واضح API پیرامیٹر کے طور پر ظاہر کرتا ہے۔
Custom Tools اینڈ پوائنٹ
ایک الگ اینڈ پوائنٹ، gemini-3.1-pro-preview-customtools، شیل کمانڈز اور حسب ضرورت ٹولز ملانے والی ایجنٹک ایپلیکیشنز کے لیے بہتر بنایا گیا ہے۔ یہ صحیح ٹول انتخاب اور فعالیت کو ترجیح دیتا ہے، جب ایجنٹس بیرونی نظاموں سے تعامل کرتے ہیں تو غلطیاں کم کرتا ہے۔ یہ GitHub Agentic Workflows جیسے ایجنٹس بنانے والے ڈیولپرز کے لیے متعلقہ ہے، جہاں ٹول انتخاب کی درستگی براہ راست آٹومیشن کی قابل اعتمادی کو متاثر کرتی ہے۔
YouTube URL ان پٹ
ڈیولپرز YouTube URLs براہ راست پرامپٹس میں داخل کر سکتے ہیں۔ ماڈل ویڈیو مواد کا تجزیہ کرتا ہے، جس سے ویڈیو سمجھنے کو کوڈ تخلیق یا ڈاکیومنٹیشن کے ساتھ ملانے والے ورک فلوز ممکن ہوتے ہیں۔
کثیر نمائشی پروسیسنگ
Gemini 3.1 Pro ایک سیاق و سباق میں ٹیکسٹ، تصاویر، آڈیو، ویڈیو، اور کوڈ سنبھالتا ہے۔ 1M ٹوکن ان پٹ ونڈو کے ساتھ، یہ ایک ہی درخواست میں پورے کوڈ بیسز یا طویل تحقیقی دستاویزات پروسیس کر سکتا ہے۔
RE-Bench: ML تحقیق کارکردگی
RE-Bench پر، جو ML تحقیق اور ترقی کی صلاحیتوں کا جائزہ لیتا ہے، Gemini 3.1 Pro 1.27 اسکور کرتا ہے (انسانی معمول کے مطابق)، Gemini 3 Pro کے 1.04 سے اوپر۔ ماڈل نے اصلاحی کام 47 سیکنڈ میں مکمل کیے بمقابلہ 94 سیکنڈ انسانی حوالہ۔
Gemini 3.1 Pro دستیابی
Gemini 3.1 Pro Gemini ایپ، Google Cloud Vertex AI، Google AI Studio، اور Gemini API میں دستیاب ہے۔ قیمت پلیٹ فارم کے لحاظ سے مختلف ہے۔ ماڈل پیش نظارے میں ہے؛ عام دستیابی متوقع ہے۔
اکثر پوچھے جانے والے سوالات
Gemini 3.1 Pro کیا ہے؟
Gemini 3.1 Pro کا Claude Opus 4.6 سے موازنہ کیسے ہے؟
Gemini 3.1 Pro میں thinking_level پیرامیٹر کیا ہے؟
Gemini 3.1 Pro میں custom tools اینڈ پوائنٹ کیا ہے؟
اپ ڈیٹ رہیں
تازہ ترین AI خبریں اپنے ان باکس میں حاصل کریں۔
