Výsledky benchmarků Gemini 3.1 Pro
Google DeepMind vydal Gemini 3.1 Pro 19. února 2026. Model více než zdvojnásobuje výkon v uvažování svého předchůdce a dosahuje 77,1 % na ARC-AGI-2 oproti Gemini 3 Pro.
Gemini 3.1 Pro cílí na úlohy vyžadující vícekrokové uvažování: návrh algoritmů, rozsáhlou syntézu dat, agentické pracovní postupy a složité kódování.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| Benchmark | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77,1 % | — | — |
| RE-Bench (ML VaV) | 1,27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64,0 % |
| Humanity's Last Exam | — | #1 | — |
| Kontext (vstup) | 1M | 200K (1M beta) | 400K |
| Kontext (výstup) | 64K | 128K | 128K |
Každý model vede v jiných oblastech. Gemini 3.1 Pro vede v benchmarcích nového uvažování. Claude Opus 4.6 vede v agentickém kódování a multidisciplinárním uvažování. GPT-5.2-Codex nabízí konkurenční výkon v kódování za nižší cenu.
Klíčové funkce pro vývojáře
Nastavitelná hloubka uvažování
Gemini 3.1 Pro zavádí parametr thinking_level řídící hloubku uvažování. Nízké uvažování je rychlé a levné pro rutinní úlohy. Vysoké uvažování aplikuje více výpočtů na složité problémy.
To je podobné ovládání úsilí Claude Opus 4.6, i když Gemini exponuje nastavení jako explicitní API parametr namísto adaptivního chování modelu.
Custom Tools Endpoint
Samostatný endpoint gemini-3.1-pro-preview-customtools je optimalizován pro agentické aplikace kombinující příkazy shellu s vlastními nástroji. Upřednostňuje správný výběr a vyvolání nástrojů, čímž snižuje chyby při interakci agentů s externími systémy. To je relevantní pro vývojáře budující agenty podobné GitHub Agentic Workflows, kde přesnost výběru nástrojů přímo ovlivňuje spolehlivost automatizace.
Vstup YouTube URL
Vývojáři mohou předávat YouTube URL přímo do promptů. Model analyzuje obsah videa, což umožňuje pracovní postupy kombinující porozumění videu s generováním kódu nebo dokumentace.
Multimodální zpracování
Gemini 3.1 Pro zpracovává text, obrázky, audio, video a kód v jednom kontextu. S vstupním oknem 1M tokenů dokáže zpracovat celé kódové báze nebo dlouhé výzkumné dokumenty v jednom průchodu.
RE-Bench: Výkon v ML výzkumu
Na RE-Bench, který hodnotí schopnosti ML výzkumu a vývoje, dosahuje Gemini 3.1 Pro 1,27 (normalizováno vůči lidským výsledkům), oproti 1,04 u Gemini 3 Pro. Model dokončil optimalizační úlohy za 47 sekund oproti lidské referenci 94 sekund.
Dostupnost Gemini 3.1 Pro
Gemini 3.1 Pro je dostupný v aplikaci Gemini, Google Cloud Vertex AI, Google AI Studio a přes Gemini API. Ceny se liší podle platformy. Model je v náhledu; obecná dostupnost se očekává v následujícím období.
Často kladené dotazy
Co je Gemini 3.1 Pro?
Jak si Gemini 3.1 Pro stojí ve srovnání s Claude Opus 4.6?
Co je parametr thinking_level v Gemini 3.1 Pro?
Co je custom tools endpoint v Gemini 3.1 Pro?
Buďte v obraze
Dostávejte nejnovější AI zprávy do schránky.
