Code Velocity
AI modely

Gemini 3.1 Pro: Model Google zaměřený na uvažování

·6 min čtení·Google, Google DeepMind·Původní zdroj
Sdílet
Srovnání benchmarků Gemini 3.1 Pro zobrazující výsledky ARC-AGI-2 a RE-Bench oproti Gemini 3 Pro a dalším frontier modelům

Výsledky benchmarků Gemini 3.1 Pro

Google DeepMind vydal Gemini 3.1 Pro 19. února 2026. Model více než zdvojnásobuje výkon v uvažování svého předchůdce a dosahuje 77,1 % na ARC-AGI-2 oproti Gemini 3 Pro.

Gemini 3.1 Pro cílí na úlohy vyžadující vícekrokové uvažování: návrh algoritmů, rozsáhlou syntézu dat, agentické pracovní postupy a složité kódování.

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2

BenchmarkGemini 3.1 ProClaude Opus 4.6GPT-5.2-Codex
ARC-AGI-277,1 %
RE-Bench (ML VaV)1,27
Terminal-Bench 2.0#164,0 %
Humanity's Last Exam#1
Kontext (vstup)1M200K (1M beta)400K
Kontext (výstup)64K128K128K

Každý model vede v jiných oblastech. Gemini 3.1 Pro vede v benchmarcích nového uvažování. Claude Opus 4.6 vede v agentickém kódování a multidisciplinárním uvažování. GPT-5.2-Codex nabízí konkurenční výkon v kódování za nižší cenu.

Klíčové funkce pro vývojáře

Nastavitelná hloubka uvažování

Gemini 3.1 Pro zavádí parametr thinking_level řídící hloubku uvažování. Nízké uvažování je rychlé a levné pro rutinní úlohy. Vysoké uvažování aplikuje více výpočtů na složité problémy.

To je podobné ovládání úsilí Claude Opus 4.6, i když Gemini exponuje nastavení jako explicitní API parametr namísto adaptivního chování modelu.

Custom Tools Endpoint

Samostatný endpoint gemini-3.1-pro-preview-customtools je optimalizován pro agentické aplikace kombinující příkazy shellu s vlastními nástroji. Upřednostňuje správný výběr a vyvolání nástrojů, čímž snižuje chyby při interakci agentů s externími systémy. To je relevantní pro vývojáře budující agenty podobné GitHub Agentic Workflows, kde přesnost výběru nástrojů přímo ovlivňuje spolehlivost automatizace.

Vstup YouTube URL

Vývojáři mohou předávat YouTube URL přímo do promptů. Model analyzuje obsah videa, což umožňuje pracovní postupy kombinující porozumění videu s generováním kódu nebo dokumentace.

Multimodální zpracování

Gemini 3.1 Pro zpracovává text, obrázky, audio, video a kód v jednom kontextu. S vstupním oknem 1M tokenů dokáže zpracovat celé kódové báze nebo dlouhé výzkumné dokumenty v jednom průchodu.

RE-Bench: Výkon v ML výzkumu

Na RE-Bench, který hodnotí schopnosti ML výzkumu a vývoje, dosahuje Gemini 3.1 Pro 1,27 (normalizováno vůči lidským výsledkům), oproti 1,04 u Gemini 3 Pro. Model dokončil optimalizační úlohy za 47 sekund oproti lidské referenci 94 sekund.

Dostupnost Gemini 3.1 Pro

Gemini 3.1 Pro je dostupný v aplikaci Gemini, Google Cloud Vertex AI, Google AI Studio a přes Gemini API. Ceny se liší podle platformy. Model je v náhledu; obecná dostupnost se očekává v následujícím období.

Často kladené dotazy

Co je Gemini 3.1 Pro?
Gemini 3.1 Pro je vylepšení řady Gemini 3 od Google DeepMind optimalizované pro uvažování, vydané 19. února 2026. Dosahuje 77,1 % na ARC-AGI-2, čímž více než zdvojnásobuje výkon v uvažování oproti Gemini 3 Pro. Model podporuje 1M tokenů vstupního kontextu a 64K výstupních tokenů a zavádí parametr thinking_level, který umožňuje vývojářům řídit, jak hluboko model uvažuje před odpovědí.
Jak si Gemini 3.1 Pro stojí ve srovnání s Claude Opus 4.6?
Gemini 3.1 Pro a Claude Opus 4.6 cílí na různé silné stránky. Gemini 3.1 Pro vede na ARC-AGI-2 (77,1 %) a RE-Bench pro ML výzkum a vývoj, zatímco Claude Opus 4.6 drží první pozici na Terminal-Bench 2.0 pro agentické kódování a Humanity's Last Exam pro multidisciplinární uvažování. Oba nabízejí kontextové okno 1M tokenů. Volba závisí na typu práce: Gemini vyniká v nových úlohách uvažování, Claude v nepřetržité kódovací práci.
Co je parametr thinking_level v Gemini 3.1 Pro?
Parametr thinking_level umožňuje vývojářům řídit maximální hloubku uvažování, kterou model aplikuje před vytvořením odpovědi. Nízké uvažování je rychlejší a levnější pro jednoduché úlohy. Vysoké uvažování alokuje více výpočetního času pro složité problémy. To dává vývojářům explicitní kontrolu nad kompromisem mezi náklady, rychlostí a kvalitou, podobně jako ovládání úsilí v Claude Opus 4.6.
Co je custom tools endpoint v Gemini 3.1 Pro?
Gemini 3.1 Pro zahrnuje samostatný API endpoint s názvem gemini-3.1-pro-preview-customtools, optimalizovaný pro upřednostňování vlastních vývojářských nástrojů. Při budování agentických aplikací s kombinací bash příkazů a vlastních nástrojů tento endpoint zajišťuje, že model správně vybírá a vyvolává správný nástroj. To je zvláště užitečné pro vývojáře budující AI agenty, kteří potřebují interagovat s externími systémy a API.

Buďte v obraze

Dostávejte nejnovější AI zprávy do schránky.

Sdílet