Gemini 3.1 Pro benchmark nəticələri
Google DeepMind 19 fevral 2026-da Gemini 3.1 Pro-nu buraxdı. Model sələfinin mühakimə performansını ikidən çox artırdı, ARC-AGI-2-də Gemini 3 Pro ilə müqayisədə 77,1% qazandı.
Gemini 3.1 Pro çoxmərhələli mühakimə tələb edən tapşırıqları hədəfləyir: alqoritm dizaynı, geniş miqyaslı data sintezi, agentik iş axınları və mürəkkəb kodlaşdırma.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| Benchmark | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77,1% | — | — |
| RE-Bench (ML R&D) | 1,27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64,0% |
| Humanity's Last Exam | — | #1 | — |
| Kontekst (giriş) | 1M | 200K (1M beta) | 400K |
| Kontekst (çıxış) | 64K | 128K | 128K |
Hər model müxtəlif sahələrdə liderdir. Gemini 3.1 Pro yeni mühakimə benchmarklarında birincidır. Claude Opus 4.6 agentik kodlaşdırma və interdissiplinar mühakimədə liderdir. GPT-5.2-Codex aşağı qiymətə rəqabətədavamlı kodlaşdırma performansı təklif edir.
Developerlər üçün əsas xüsusiyyətlər
Konfiqurasiya edilə bilən düşünmə dərinliyi
Gemini 3.1 Pro mühakimə dərinliyini idarə edən thinking_level parametrini təqdim edir. Aşağı düşünmə rutin tapşırıqlar üçün sürətli və ucuzdur. Yüksək düşünmə mürəkkəb problemlərə daha çox hesablama tətbiq edir.
Bu, Claude Opus 4.6-nın səy nəzarətlərinə bənzəyir, baxmayaraq ki Gemini tənzimləməni adaptiv model davranışı əvəzinə açıq API parametri kimi təqdim edir.
Xüsusi alətlər endpoint
Ayrıca endpoint, gemini-3.1-pro-preview-customtools, shell əmrləri ilə xüsusi alətləri birləşdirən agentik tətbiqlər üçün optimallaşdırılıb. Düzgün alət seçimi və çağırışına üstünlük verir, agentlər xarici sistemlərlə əlaqə qurarkən xətaları azaldır. Bu, GitHub Agentic Workflows kimi agentlər quran developerlər üçün aktualdır, burada alət seçimi dəqiqliyi avtomatlaşdırmanın etibarlılığına birbaşa təsir edir.
YouTube URL girişi
Developerlər YouTube URL-lərini birbaşa promptlara ötürə bilər. Model video məzmununu təhlil edir, video anlayışını kod generasiyası və ya sənədləşdirmə ilə birləşdirən iş axınlarını mümkün edir.
Multimodal emal
Gemini 3.1 Pro mətn, şəkillər, audio, video və kodu bir kontekstdə emal edir. 1M token giriş pəncərəsi ilə bütün kod bazalarını və ya uzun araşdırma sənədlərini bir keçiddə emal edə bilir.
RE-Bench: ML araşdırma performansı
ML araşdırma və inkişaf qabiliyyətlərini qiymətləndirən RE-Bench-də Gemini 3.1 Pro 1,27 (insan normallaşdırılmış) qazandı, Gemini 3 Pro-nun 1,04-ündən yüksəldi. Model optimallaşdırma tapşırıqlarını 94 saniyəlik insan referansı ilə müqayisədə 47 saniyədə tamamladı.
Gemini 3.1 Pro mövcudluğu
Gemini 3.1 Pro Gemini tətbiqində, Google Cloud Vertex AI-da, Google AI Studio-da və Gemini API-də mövcuddur. Qiymətlər platformaya görə dəyişir. Model ön baxış mərhələsindədir; ümumi mövcudluğun tezliklə olacağı gözlənilir.
Tez-tez Verilən Suallar
Gemini 3.1 Pro nədir?
Gemini 3.1 Pro Claude Opus 4.6 ilə necə müqayisə olunur?
Gemini 3.1 Pro-da thinking_level parametri nədir?
Gemini 3.1 Pro-da xüsusi alətlər endpoint nədir?
Xəbərdar olun
Ən son AI xəbərlərini e-poçtunuza alın.
