Code Velocity
AI मॉडल

Gemini 3.1 Pro: Google का रीज़निंग-फ़र्स्ट मॉडल

·6 मिनट पढ़ें·Google, Google DeepMind·मूल स्रोत
शेयर करें
Gemini 3.1 Pro बेंचमार्क तुलना जो ARC-AGI-2 और RE-Bench स्कोर को Gemini 3 Pro और अन्य फ्रंटियर मॉडलों से दिखाती है

Gemini 3.1 Pro बेंचमार्क परिणाम

Google DeepMind ने 19 फरवरी 2026 को Gemini 3.1 Pro रिलीज़ किया। मॉडल ने अपने पूर्ववर्ती के रीज़निंग प्रदर्शन से दोगुने से अधिक स्कोर किया, ARC-AGI-2 पर 77.1% बनाम Gemini 3 Pro।

Gemini 3.1 Pro मल्टी-स्टेप रीज़निंग की आवश्यकता वाले कार्यों को लक्षित करता है: एल्गोरिदम डिज़ाइन, बड़े पैमाने पर डेटा संश्लेषण, एजेंटिक वर्कफ़्लो, और जटिल कोडिंग।

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2

बेंचमार्कGemini 3.1 ProClaude Opus 4.6GPT-5.2-Codex
ARC-AGI-277.1%
RE-Bench (ML R&D)1.27
Terminal-Bench 2.0#164.0%
Humanity's Last Exam#1
कॉन्टेक्स्ट (इनपुट)1M200K (1M बीटा)400K
कॉन्टेक्स्ट (आउटपुट)64K128K128K

प्रत्येक मॉडल अलग-अलग क्षेत्रों में अग्रणी है। Gemini 3.1 Pro नवीन रीज़निंग बेंचमार्क में शीर्ष पर है। Claude Opus 4.6 एजेंटिक कोडिंग और बहु-विषयक रीज़निंग में अग्रणी है। GPT-5.2-Codex कम कीमत पर प्रतिस्पर्धी कोडिंग प्रदर्शन प्रदान करता है।

डेवलपर्स के लिए प्रमुख फीचर्स

कॉन्फ़िगर करने योग्य Thinking Depth

Gemini 3.1 Pro एक thinking_level पैरामीटर पेश करता है जो रीज़निंग गहराई को नियंत्रित करता है। Low thinking दैनिक कार्यों के लिए तेज़ और सस्ता है। High thinking जटिल समस्याओं पर अधिक कंप्यूटेशन लागू करता है।

यह Claude Opus 4.6 के एफ़र्ट कंट्रोल के समान है, हालाँकि Gemini सेटिंग को अनुकूली मॉडल व्यवहार की बजाय एक स्पष्ट API पैरामीटर के रूप में उपलब्ध कराता है।

Custom Tools Endpoint

एक अलग endpoint, gemini-3.1-pro-preview-customtools, शेल कमांड और कस्टम टूल्स को जोड़ने वाले एजेंटिक अनुप्रयोगों के लिए ऑप्टिमाइज़्ड है। यह सही टूल चयन और आह्वान को प्राथमिकता देता है, जब एजेंट बाहरी सिस्टम के साथ इंटरैक्ट करते हैं तो त्रुटियों को कम करता है। यह GitHub Agentic Workflows जैसे एजेंट बनाने वाले डेवलपर्स के लिए प्रासंगिक है, जहाँ टूल चयन सटीकता सीधे ऑटोमेशन विश्वसनीयता को प्रभावित करती है।

YouTube URL इनपुट

डेवलपर्स सीधे प्रॉम्प्ट में YouTube URL पास कर सकते हैं। मॉडल वीडियो कंटेंट का विश्लेषण करता है, जिससे वीडियो समझ को कोड जनरेशन या डॉक्यूमेंटेशन के साथ जोड़ने वाले वर्कफ़्लो सक्षम होते हैं।

मल्टीमोडल प्रोसेसिंग

Gemini 3.1 Pro एक ही कॉन्टेक्स्ट में टेक्स्ट, इमेज, ऑडियो, वीडियो, और कोड को हैंडल करता है। 1M टोकन इनपुट विंडो के साथ, यह एक ही पास में पूरे कोडबेस या लंबे रिसर्च दस्तावेज़ प्रोसेस कर सकता है।

RE-Bench: ML रिसर्च प्रदर्शन

RE-Bench पर, जो ML रिसर्च और डेवलपमेंट क्षमताओं का मूल्यांकन करता है, Gemini 3.1 Pro ने 1.27 (मानव-सामान्यीकृत) स्कोर किया, Gemini 3 Pro के 1.04 से ऊपर। मॉडल ने 94-सेकंड मानव संदर्भ की तुलना में 47 सेकंड में ऑप्टिमाइज़ेशन कार्य पूरे किए।

Gemini 3.1 Pro उपलब्धता

Gemini 3.1 Pro Gemini ऐप, Google Cloud Vertex AI, Google AI Studio, और Gemini API में उपलब्ध है। मूल्य निर्धारण प्लेटफ़ॉर्म के अनुसार भिन्न होता है। मॉडल प्रीव्यू में है; सामान्य उपलब्धता जल्द अपेक्षित है।

अक्सर पूछे जाने वाले प्रश्न

Gemini 3.1 Pro क्या है?
Gemini 3.1 Pro, Google DeepMind का Gemini 3 सीरीज़ का रीज़निंग-ऑप्टिमाइज़्ड अपग्रेड है, जो 19 फरवरी 2026 को रिलीज़ हुआ। इसने ARC-AGI-2 पर 77.1% स्कोर किया, Gemini 3 Pro के रीज़निंग प्रदर्शन से दोगुने से अधिक। मॉडल 1M टोकन इनपुट कॉन्टेक्स्ट और 64K आउटपुट टोकन सपोर्ट करता है, और एक thinking_level पैरामीटर पेश करता है जो डेवलपर्स को यह नियंत्रित करने देता है कि मॉडल जवाब देने से पहले कितनी गहराई से सोचे।
Gemini 3.1 Pro की तुलना Claude Opus 4.6 से कैसे है?
Gemini 3.1 Pro और Claude Opus 4.6 अलग-अलग ताकतों को लक्षित करते हैं। Gemini 3.1 Pro ARC-AGI-2 (77.1%) और ML R&D के लिए RE-Bench पर अग्रणी है, जबकि Claude Opus 4.6 एजेंटिक कोडिंग के लिए Terminal-Bench 2.0 और बहु-विषयक रीज़निंग के लिए Humanity's Last Exam पर शीर्ष स्थान रखता है। दोनों 1M टोकन कॉन्टेक्स्ट विंडो प्रदान करते हैं। चुनाव कार्यभार पर निर्भर करता है: Gemini नवीन रीज़निंग कार्यों में उत्कृष्ट है, Claude निरंतर कोडिंग कार्य में।
Gemini 3.1 Pro में thinking_level पैरामीटर क्या है?
thinking_level पैरामीटर डेवलपर्स को मॉडल द्वारा जवाब देने से पहले लागू की जाने वाली अधिकतम रीज़निंग गहराई को नियंत्रित करने देता है। Low thinking सीधे कार्यों के लिए तेज़ और सस्ता है। High thinking जटिल रीज़निंग समस्याओं के लिए अधिक कंप्यूटेशन समय आवंटित करता है। इससे डेवलपर्स को लागत-गति-गुणवत्ता ट्रेडऑफ़ पर स्पष्ट नियंत्रण मिलता है, Claude Opus 4.6 के एफ़र्ट कंट्रोल के समान।
Gemini 3.1 Pro में custom tools endpoint क्या है?
Gemini 3.1 Pro में gemini-3.1-pro-preview-customtools नामक एक अलग API endpoint शामिल है, जो कस्टम डेवलपर टूल्स को प्राथमिकता देने के लिए ऑप्टिमाइज़्ड है। bash कमांड और कस्टम टूल्स के मिश्रण वाले एजेंटिक अनुप्रयोग बनाते समय, यह endpoint सुनिश्चित करता है कि मॉडल सही टूल का सही ढंग से चयन और आह्वान करे। यह विशेष रूप से उन डेवलपर्स के लिए उपयोगी है जो बाहरी सिस्टम और API के साथ इंटरैक्ट करने वाले AI एजेंट बना रहे हैं।

अपडेट रहें

नवीनतम AI समाचार अपने इनबॉक्स में पाएं।

शेयर करें