Code Velocity
AI modely

Gemini 3.1 Pro: model Google zameraný na uvažovanie

·6 min čítania·Google, Google DeepMind·Pôvodný zdroj
Zdieľať
Porovnanie benchmarkov Gemini 3.1 Pro zobrazujúce skóre ARC-AGI-2 a RE-Bench oproti Gemini 3 Pro a iným špičkovým modelom

Výsledky benchmarkov Gemini 3.1 Pro

Google DeepMind vydal Gemini 3.1 Pro 19. februára 2026. Model viac než zdvojnásobil výkon uvažovania svojho predchodcu, keď dosiahol 77,1 % na ARC-AGI-2 oproti Gemini 3 Pro.

Gemini 3.1 Pro cieľuje na úlohy vyžadujúce viacstupňové uvažovanie: návrh algoritmov, syntézu dát vo veľkom meradle, agentické pracovné postupy a komplexné kódovanie.

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2

BenchmarkGemini 3.1 ProClaude Opus 4.6GPT-5.2-Codex
ARC-AGI-277,1 %
RE-Bench (ML R&D)1,27
Terminal-Bench 2.0#164,0 %
Humanity's Last Exam#1
Kontext (vstup)1M200K (1M beta)400K
Kontext (výstup)64K128K128K

Každý model vedie v rôznych oblastiach. Gemini 3.1 Pro vedie v nových benchmarkoch uvažovania. Claude Opus 4.6 vedie v agentickom kódovaní a multidisciplinárnom uvažovaní. GPT-5.2-Codex ponúka konkurenčný výkon kódovania za nižšie ceny.

Kľúčové funkcie pre vývojárov

Konfigurovateľná hĺbka uvažovania

Gemini 3.1 Pro zavádza parameter thinking_level ovládajúci hĺbku uvažovania. Nízke uvažovanie je rýchle a lacné pre bežné úlohy. Vysoké uvažovanie aplikuje viac výpočtov na zložité problémy.

Je to podobné ovládačom úsilia Claude Opus 4.6, hoci Gemini sprístupňuje nastavenie ako explicitný API parameter namiesto adaptívneho správania modelu.

Endpoint pre vlastné nástroje

Samostatný endpoint, gemini-3.1-pro-preview-customtools, je optimalizovaný pre agentické aplikácie kombinujúce shell príkazy s vlastnými nástrojmi. Uprednostňuje správny výber a vyvolanie nástrojov, čím znižuje chyby pri interakcii agentov s externými systémami. Je to relevantné pre vývojárov budujúcich agentov podobných GitHub Agentic Workflows, kde presnosť výberu nástrojov priamo ovplyvňuje spoľahlivosť automatizácie.

Vstup YouTube URL

Vývojári môžu odosielať YouTube URL priamo v promptoch. Model analyzuje video obsah, čo umožňuje pracovné postupy kombinujúce porozumenie videa s generovaním kódu alebo dokumentácie.

Multimodálne spracovanie

Gemini 3.1 Pro spracúva text, obrázky, zvuk, video a kód v jednom kontexte. S vstupným oknom 1M tokenov dokáže spracovať celé kódové bázy alebo dlhé výskumné dokumenty v jednom priechode.

RE-Bench: výkon v ML výskume

Na RE-Bench, ktorý hodnotí schopnosti výskumu a vývoja v ML, Gemini 3.1 Pro dosiahol 1,27 (ľudsky normalizované), oproti 1,04 u Gemini 3 Pro. Model dokončil optimalizačné úlohy za 47 sekúnd oproti 94-sekundovej ľudskej referencii.

Dostupnosť Gemini 3.1 Pro

Gemini 3.1 Pro je dostupný v aplikácii Gemini, Google Cloud Vertex AI, Google AI Studio a Gemini API. Ceny sa líšia podľa platformy. Model je v náhľade; všeobecná dostupnosť sa očakáva neskôr.

Často kladené otázky

Čo je Gemini 3.1 Pro?
Gemini 3.1 Pro je aktualizácia série Gemini 3 od Google DeepMind optimalizovaná pre uvažovanie, vydaná 19. februára 2026. Dosiahol 77,1 % na ARC-AGI-2, čím viac než zdvojnásobil výkon uvažovania Gemini 3 Pro. Model podporuje vstupný kontext 1M tokenov a výstup 64K tokenov a zavádza parameter thinking_level, ktorý umožňuje vývojárom kontrolovať hĺbku uvažovania modelu pred odpoveďou.
Ako sa Gemini 3.1 Pro porovnáva s Claude Opus 4.6?
Gemini 3.1 Pro a Claude Opus 4.6 cieľujú na rôzne silné stránky. Gemini 3.1 Pro vedie na ARC-AGI-2 (77,1 %) a RE-Bench pre ML R&D, zatiaľ čo Claude Opus 4.6 drží prednú pozíciu na Terminal-Bench 2.0 pre agentické kódovanie a Humanity's Last Exam pre multidisciplinárne uvažovanie. Oba ponúkajú kontextové okná s 1M tokenmi. Výber závisí od pracovného zaťaženia: Gemini exceluje v nových úlohách uvažovania, Claude v dlhodobej práci s kódom.
Čo je parameter thinking_level v Gemini 3.1 Pro?
Parameter thinking_level umožňuje vývojárom kontrolovať maximálnu hĺbku uvažovania, ktorú model použije pred vytvorením odpovede. Nízke uvažovanie je rýchlejšie a lacnejšie pre jednoduché úlohy. Vysoké uvažovanie prideľuje viac výpočtového času pre zložité problémy uvažovania. Toto dáva vývojárom explicitnú kontrolu nad kompromisom medzi cenou, rýchlosťou a kvalitou, podobne ako ovládače úsilia v Claude Opus 4.6.
Čo je endpoint pre vlastné nástroje v Gemini 3.1 Pro?
Gemini 3.1 Pro zahŕňa samostatný API endpoint s názvom gemini-3.1-pro-preview-customtools, optimalizovaný pre uprednostnenie vlastných nástrojov vývojárov. Pri budovaní agentických aplikácií s kombináciou bash príkazov a vlastných nástrojov tento endpoint zabezpečuje, že model správne vyberie a vyvolá správny nástroj. Je to obzvlášť užitočné pre vývojárov budujúcich AI agentov, ktorí potrebujú interagovať s externými systémami a API.

Buďte informovaní

Dostávajte najnovšie AI správy do schránky.

Zdieľať