Výsledky benchmarkov Gemini 3.1 Pro
Google DeepMind vydal Gemini 3.1 Pro 19. februára 2026. Model viac než zdvojnásobil výkon uvažovania svojho predchodcu, keď dosiahol 77,1 % na ARC-AGI-2 oproti Gemini 3 Pro.
Gemini 3.1 Pro cieľuje na úlohy vyžadujúce viacstupňové uvažovanie: návrh algoritmov, syntézu dát vo veľkom meradle, agentické pracovné postupy a komplexné kódovanie.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| Benchmark | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77,1 % | — | — |
| RE-Bench (ML R&D) | 1,27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64,0 % |
| Humanity's Last Exam | — | #1 | — |
| Kontext (vstup) | 1M | 200K (1M beta) | 400K |
| Kontext (výstup) | 64K | 128K | 128K |
Každý model vedie v rôznych oblastiach. Gemini 3.1 Pro vedie v nových benchmarkoch uvažovania. Claude Opus 4.6 vedie v agentickom kódovaní a multidisciplinárnom uvažovaní. GPT-5.2-Codex ponúka konkurenčný výkon kódovania za nižšie ceny.
Kľúčové funkcie pre vývojárov
Konfigurovateľná hĺbka uvažovania
Gemini 3.1 Pro zavádza parameter thinking_level ovládajúci hĺbku uvažovania. Nízke uvažovanie je rýchle a lacné pre bežné úlohy. Vysoké uvažovanie aplikuje viac výpočtov na zložité problémy.
Je to podobné ovládačom úsilia Claude Opus 4.6, hoci Gemini sprístupňuje nastavenie ako explicitný API parameter namiesto adaptívneho správania modelu.
Endpoint pre vlastné nástroje
Samostatný endpoint, gemini-3.1-pro-preview-customtools, je optimalizovaný pre agentické aplikácie kombinujúce shell príkazy s vlastnými nástrojmi. Uprednostňuje správny výber a vyvolanie nástrojov, čím znižuje chyby pri interakcii agentov s externými systémami. Je to relevantné pre vývojárov budujúcich agentov podobných GitHub Agentic Workflows, kde presnosť výberu nástrojov priamo ovplyvňuje spoľahlivosť automatizácie.
Vstup YouTube URL
Vývojári môžu odosielať YouTube URL priamo v promptoch. Model analyzuje video obsah, čo umožňuje pracovné postupy kombinujúce porozumenie videa s generovaním kódu alebo dokumentácie.
Multimodálne spracovanie
Gemini 3.1 Pro spracúva text, obrázky, zvuk, video a kód v jednom kontexte. S vstupným oknom 1M tokenov dokáže spracovať celé kódové bázy alebo dlhé výskumné dokumenty v jednom priechode.
RE-Bench: výkon v ML výskume
Na RE-Bench, ktorý hodnotí schopnosti výskumu a vývoja v ML, Gemini 3.1 Pro dosiahol 1,27 (ľudsky normalizované), oproti 1,04 u Gemini 3 Pro. Model dokončil optimalizačné úlohy za 47 sekúnd oproti 94-sekundovej ľudskej referencii.
Dostupnosť Gemini 3.1 Pro
Gemini 3.1 Pro je dostupný v aplikácii Gemini, Google Cloud Vertex AI, Google AI Studio a Gemini API. Ceny sa líšia podľa platformy. Model je v náhľade; všeobecná dostupnosť sa očakáva neskôr.
Často kladené otázky
Čo je Gemini 3.1 Pro?
Ako sa Gemini 3.1 Pro porovnáva s Claude Opus 4.6?
Čo je parameter thinking_level v Gemini 3.1 Pro?
Čo je endpoint pre vlastné nástroje v Gemini 3.1 Pro?
Buďte informovaní
Dostávajte najnovšie AI správy do schránky.
