Gemini 3.1 Pro बेंचमार्क परिणाम
Google DeepMind ने 19 फरवरी 2026 को Gemini 3.1 Pro रिलीज़ किया। मॉडल ने अपने पूर्ववर्ती के रीज़निंग प्रदर्शन से दोगुने से अधिक स्कोर किया, ARC-AGI-2 पर 77.1% बनाम Gemini 3 Pro।
Gemini 3.1 Pro मल्टी-स्टेप रीज़निंग की आवश्यकता वाले कार्यों को लक्षित करता है: एल्गोरिदम डिज़ाइन, बड़े पैमाने पर डेटा संश्लेषण, एजेंटिक वर्कफ़्लो, और जटिल कोडिंग।
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| बेंचमार्क | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77.1% | — | — |
| RE-Bench (ML R&D) | 1.27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64.0% |
| Humanity's Last Exam | — | #1 | — |
| कॉन्टेक्स्ट (इनपुट) | 1M | 200K (1M बीटा) | 400K |
| कॉन्टेक्स्ट (आउटपुट) | 64K | 128K | 128K |
प्रत्येक मॉडल अलग-अलग क्षेत्रों में अग्रणी है। Gemini 3.1 Pro नवीन रीज़निंग बेंचमार्क में शीर्ष पर है। Claude Opus 4.6 एजेंटिक कोडिंग और बहु-विषयक रीज़निंग में अग्रणी है। GPT-5.2-Codex कम कीमत पर प्रतिस्पर्धी कोडिंग प्रदर्शन प्रदान करता है।
डेवलपर्स के लिए प्रमुख फीचर्स
कॉन्फ़िगर करने योग्य Thinking Depth
Gemini 3.1 Pro एक thinking_level पैरामीटर पेश करता है जो रीज़निंग गहराई को नियंत्रित करता है। Low thinking दैनिक कार्यों के लिए तेज़ और सस्ता है। High thinking जटिल समस्याओं पर अधिक कंप्यूटेशन लागू करता है।
यह Claude Opus 4.6 के एफ़र्ट कंट्रोल के समान है, हालाँकि Gemini सेटिंग को अनुकूली मॉडल व्यवहार की बजाय एक स्पष्ट API पैरामीटर के रूप में उपलब्ध कराता है।
Custom Tools Endpoint
एक अलग endpoint, gemini-3.1-pro-preview-customtools, शेल कमांड और कस्टम टूल्स को जोड़ने वाले एजेंटिक अनुप्रयोगों के लिए ऑप्टिमाइज़्ड है। यह सही टूल चयन और आह्वान को प्राथमिकता देता है, जब एजेंट बाहरी सिस्टम के साथ इंटरैक्ट करते हैं तो त्रुटियों को कम करता है। यह GitHub Agentic Workflows जैसे एजेंट बनाने वाले डेवलपर्स के लिए प्रासंगिक है, जहाँ टूल चयन सटीकता सीधे ऑटोमेशन विश्वसनीयता को प्रभावित करती है।
YouTube URL इनपुट
डेवलपर्स सीधे प्रॉम्प्ट में YouTube URL पास कर सकते हैं। मॉडल वीडियो कंटेंट का विश्लेषण करता है, जिससे वीडियो समझ को कोड जनरेशन या डॉक्यूमेंटेशन के साथ जोड़ने वाले वर्कफ़्लो सक्षम होते हैं।
मल्टीमोडल प्रोसेसिंग
Gemini 3.1 Pro एक ही कॉन्टेक्स्ट में टेक्स्ट, इमेज, ऑडियो, वीडियो, और कोड को हैंडल करता है। 1M टोकन इनपुट विंडो के साथ, यह एक ही पास में पूरे कोडबेस या लंबे रिसर्च दस्तावेज़ प्रोसेस कर सकता है।
RE-Bench: ML रिसर्च प्रदर्शन
RE-Bench पर, जो ML रिसर्च और डेवलपमेंट क्षमताओं का मूल्यांकन करता है, Gemini 3.1 Pro ने 1.27 (मानव-सामान्यीकृत) स्कोर किया, Gemini 3 Pro के 1.04 से ऊपर। मॉडल ने 94-सेकंड मानव संदर्भ की तुलना में 47 सेकंड में ऑप्टिमाइज़ेशन कार्य पूरे किए।
Gemini 3.1 Pro उपलब्धता
Gemini 3.1 Pro Gemini ऐप, Google Cloud Vertex AI, Google AI Studio, और Gemini API में उपलब्ध है। मूल्य निर्धारण प्लेटफ़ॉर्म के अनुसार भिन्न होता है। मॉडल प्रीव्यू में है; सामान्य उपलब्धता जल्द अपेक्षित है।
अक्सर पूछे जाने वाले प्रश्न
Gemini 3.1 Pro क्या है?
Gemini 3.1 Pro की तुलना Claude Opus 4.6 से कैसे है?
Gemini 3.1 Pro में thinking_level पैरामीटर क्या है?
Gemini 3.1 Pro में custom tools endpoint क्या है?
अपडेट रहें
नवीनतम AI समाचार अपने इनबॉक्स में पाएं।
