Rezultatele Benchmark ale Gemini 3.1 Pro
Google DeepMind a lansat Gemini 3.1 Pro pe 19 februarie 2026. Modelul mai mult decât dublează performanța de raționament a predecesorului său, obținând 77.1% pe ARC-AGI-2 comparativ cu rezultatul Gemini 3 Pro.
Gemini 3.1 Pro este proiectat pentru sarcini unde un răspuns direct nu este suficient: design de algoritmi, sinteză de date la scară largă, workflow-uri agentice și programare complexă.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| Benchmark | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77.1% | — | — |
| RE-Bench (R&D ML) | 1.27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64.0% |
| Humanity's Last Exam | — | #1 | — |
| Context (intrare) | 1M | 200K (1M beta) | 400K |
| Context (ieșire) | 64K | 128K | 128K |
Fiecare model conduce în domenii diferite. Gemini 3.1 Pro se distinge pe benchmark-uri de raționament nou. Claude Opus 4.6 conduce în programare agentică și raționament multidisciplinar. GPT-5.2-Codex oferă performanță competitivă în programare la un preț mai mic.
Funcționalități Cheie pentru Dezvoltatori
Profunzime de Raționament Configurabilă
Gemini 3.1 Pro introduce un parametru thinking_level care controlează cât de profund raționează modelul înainte de a răspunde. Thinking scăzut este rapid și ieftin pentru sarcini de rutină. Thinking ridicat aplică mai multă computație pentru probleme complexe.
Este conceptual similar cu gândirea adaptivă și controalele de efort din Claude Opus 4.6, deși implementarea Gemini expune controlul ca un parametru explicit al API-ului în loc de un comportament adaptiv al modelului.
Endpoint de Instrumente Personalizate
Un endpoint separat, gemini-3.1-pro-preview-customtools, este optimizat pentru aplicații agentice care combină comenzi shell cu instrumente personalizate. Endpoint-ul prioritizează selecția și invocarea corectă a instrumentelor, reducând erorile când agenții interacționează cu sisteme externe.
Input URL YouTube
Dezvoltatorii pot acum pasa URL-uri YouTube direct în prompts. Modelul analizează automat conținutul video, permițând workflow-uri care combină înțelegerea video cu generarea de cod sau sarcini de documentare.
Procesare Multimodală
Gemini 3.1 Pro gestionează text, imagini, audio, video și cod într-un singur context. Cu fereastra de intrare de 1M tokeni, poate procesa codebase-uri întregi, documente lungi de cercetare sau workflow-uri adânc imbricate într-o singură trecere.
RE-Bench: Performanță în Cercetarea ML
Pe RE-Bench, care evaluează capabilitățile de cercetare și dezvoltare în ML, Gemini 3.1 Pro obține un scor normalizat uman de 1.27, față de 1.04 al Gemini 3 Pro. Modelul a completat sarcini de optimizare în 47 de secunde comparativ cu referința umană de 94 de secunde.
Disponibilitatea Gemini 3.1 Pro
Gemini 3.1 Pro este disponibil în aplicația Gemini, Google Cloud Vertex AI, Google AI Studio și API-ul Gemini. Prețurile specifice variază pe platformă. Modelul este în preview cu disponibilitate generală așteptată în curând.
Întrebări frecvente
Ce este Gemini 3.1 Pro?
Cum se compară Gemini 3.1 Pro cu Claude Opus 4.6?
Ce este parametrul thinking_level în Gemini 3.1 Pro?
Ce este endpoint-ul de instrumente personalizate în Gemini 3.1 Pro?
Rămâi la curent
Primește ultimele știri AI în inbox-ul tău.
