Code Velocity
AI modelləri

Gemini 3.1 Pro: Google-un mühakimə yönümlü modeli

·6 dəq oxunma·Google, Google DeepMind·Orijinal mənbə
Paylaş
Gemini 3.1 Pro benchmark müqayisəsi, ARC-AGI-2 və RE-Bench ballarını Gemini 3 Pro və digər qabaqcıl modellərlə göstərir

Gemini 3.1 Pro benchmark nəticələri

Google DeepMind 19 fevral 2026-da Gemini 3.1 Pro-nu buraxdı. Model sələfinin mühakimə performansını ikidən çox artırdı, ARC-AGI-2-də Gemini 3 Pro ilə müqayisədə 77,1% qazandı.

Gemini 3.1 Pro çoxmərhələli mühakimə tələb edən tapşırıqları hədəfləyir: alqoritm dizaynı, geniş miqyaslı data sintezi, agentik iş axınları və mürəkkəb kodlaşdırma.

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2

BenchmarkGemini 3.1 ProClaude Opus 4.6GPT-5.2-Codex
ARC-AGI-277,1%
RE-Bench (ML R&D)1,27
Terminal-Bench 2.0#164,0%
Humanity's Last Exam#1
Kontekst (giriş)1M200K (1M beta)400K
Kontekst (çıxış)64K128K128K

Hər model müxtəlif sahələrdə liderdir. Gemini 3.1 Pro yeni mühakimə benchmarklarında birincidır. Claude Opus 4.6 agentik kodlaşdırma və interdissiplinar mühakimədə liderdir. GPT-5.2-Codex aşağı qiymətə rəqabətədavamlı kodlaşdırma performansı təklif edir.

Developerlər üçün əsas xüsusiyyətlər

Konfiqurasiya edilə bilən düşünmə dərinliyi

Gemini 3.1 Pro mühakimə dərinliyini idarə edən thinking_level parametrini təqdim edir. Aşağı düşünmə rutin tapşırıqlar üçün sürətli və ucuzdur. Yüksək düşünmə mürəkkəb problemlərə daha çox hesablama tətbiq edir.

Bu, Claude Opus 4.6-nın səy nəzarətlərinə bənzəyir, baxmayaraq ki Gemini tənzimləməni adaptiv model davranışı əvəzinə açıq API parametri kimi təqdim edir.

Xüsusi alətlər endpoint

Ayrıca endpoint, gemini-3.1-pro-preview-customtools, shell əmrləri ilə xüsusi alətləri birləşdirən agentik tətbiqlər üçün optimallaşdırılıb. Düzgün alət seçimi və çağırışına üstünlük verir, agentlər xarici sistemlərlə əlaqə qurarkən xətaları azaldır. Bu, GitHub Agentic Workflows kimi agentlər quran developerlər üçün aktualdır, burada alət seçimi dəqiqliyi avtomatlaşdırmanın etibarlılığına birbaşa təsir edir.

YouTube URL girişi

Developerlər YouTube URL-lərini birbaşa promptlara ötürə bilər. Model video məzmununu təhlil edir, video anlayışını kod generasiyası və ya sənədləşdirmə ilə birləşdirən iş axınlarını mümkün edir.

Multimodal emal

Gemini 3.1 Pro mətn, şəkillər, audio, video və kodu bir kontekstdə emal edir. 1M token giriş pəncərəsi ilə bütün kod bazalarını və ya uzun araşdırma sənədlərini bir keçiddə emal edə bilir.

RE-Bench: ML araşdırma performansı

ML araşdırma və inkişaf qabiliyyətlərini qiymətləndirən RE-Bench-də Gemini 3.1 Pro 1,27 (insan normallaşdırılmış) qazandı, Gemini 3 Pro-nun 1,04-ündən yüksəldi. Model optimallaşdırma tapşırıqlarını 94 saniyəlik insan referansı ilə müqayisədə 47 saniyədə tamamladı.

Gemini 3.1 Pro mövcudluğu

Gemini 3.1 Pro Gemini tətbiqində, Google Cloud Vertex AI-da, Google AI Studio-da və Gemini API-də mövcuddur. Qiymətlər platformaya görə dəyişir. Model ön baxış mərhələsindədir; ümumi mövcudluğun tezliklə olacağı gözlənilir.

Tez-tez Verilən Suallar

Gemini 3.1 Pro nədir?
Gemini 3.1 Pro, Google DeepMind tərəfindən hazırlanmış Gemini 3 seriyasının mühakimə üçün optimallaşdırılmış yeniləməsidir, 19 fevral 2026-da buraxılıb. ARC-AGI-2-də 77,1% qazanaraq Gemini 3 Pro-nun mühakimə performansını ikidən çox artırıb. Model 1M token giriş kontekstini və 64K çıxış tokenini dəstəkləyir və developerlərin cavab vermədən əvvəl modelin mühakimə dərinliyini idarə etməsinə imkan verən thinking_level parametrini təqdim edir.
Gemini 3.1 Pro Claude Opus 4.6 ilə necə müqayisə olunur?
Gemini 3.1 Pro və Claude Opus 4.6 fərqli güclü tərəflərə malikdir. Gemini 3.1 Pro ARC-AGI-2-də (77,1%) və ML R&D üçün RE-Bench-də liderdir, Claude Opus 4.6 isə agentik kodlaşdırma üçün Terminal-Bench 2.0-da və interdissiplinar mühakimə üçün Humanity's Last Exam-da birinci yerdədir. Hər ikisi 1M token kontekst pəncərəsi təklif edir. Seçim iş yükündən asılıdır: Gemini yeni mühakimə tapşırıqlarında, Claude isə davamlı kodlaşdırma işlərində üstündür.
Gemini 3.1 Pro-da thinking_level parametri nədir?
thinking_level parametri developerlərə modelin cavab yaratmadan əvvəl tətbiq etdiyi maksimum mühakimə dərinliyini idarə etməyə imkan verir. Aşağı düşünmə sadə tapşırıqlar üçün daha sürətli və ucuzdur. Yüksək düşünmə mürəkkəb mühakimə problemləri üçün daha çox hesablama vaxtı ayırır. Bu, developerlərə xərc-sürət-keyfiyyət kompromisi üzərində açıq nəzarət verir, Claude Opus 4.6-dakı səy nəzarətlərinə bənzər.
Gemini 3.1 Pro-da xüsusi alətlər endpoint nədir?
Gemini 3.1 Pro, developerlərin xüsusi alətlərinə üstünlük vermək üçün optimallaşdırılmış gemini-3.1-pro-preview-customtools adlı ayrıca API endpoint daxildir. Bash əmrləri və xüsusi alətlərin qarışığı ilə agentik tətbiqlər qurarkən, bu endpoint modelin düzgün aləti seçib çağırmasını təmin edir. Bu, xarici sistemlər və API-lərlə əlaqə quran AI agentləri quran developerlər üçün xüsusilə faydalıdır.

Xəbərdar olun

Ən son AI xəbərlərini e-poçtunuza alın.

Paylaş