Rezultati Benchmarkova Gemini 3.1 Pro
Google DeepMind objavio je Gemini 3.1 Pro 19. veljače 2026. Model više nego udvostručuje performanse zaključivanja svog prethodnika, postižući 77.1% na ARC-AGI-2 u usporedbi s Gemini 3 Pro.
Gemini 3.1 Pro cilja na zadatke koji zahtijevaju višekoračno zaključivanje: dizajn algoritama, sintezu podataka velikog opsega, agentne radne tokove i složeno kodiranje.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| Benchmark | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77.1% | — | — |
| RE-Bench (ML R&D) | 1.27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64.0% |
| Humanity's Last Exam | — | #1 | — |
| Kontekst (ulaz) | 1M | 200K (1M beta) | 400K |
| Kontekst (izlaz) | 64K | 128K | 128K |
Svaki model vodi u različitim područjima. Gemini 3.1 Pro predvodi benchmarkove novog zaključivanja. Claude Opus 4.6 vodi u agentnom kodiranju i multidisciplinarnom zaključivanju. GPT-5.2-Codex nudi konkurentne performanse kodiranja po nižoj cijeni.
Ključne Značajke za Programere
Prilagodljiva Dubina Zaključivanja
Gemini 3.1 Pro uvodi parametar thinking_level koji kontrolira dubinu zaključivanja. Niska razina thinkinga je brza i jeftina za rutinske zadatke. Visoka razina thinkinga primjenjuje više računanja na složene probleme.
To je slično kontrolama napora Claude Opusa 4.6, iako Gemini izlaže postavku kao eksplicitni API parametar umjesto adaptivnog ponašanja modela.
Endpoint za Custom Tools
Zaseban endpoint, gemini-3.1-pro-preview-customtools, optimiziran je za agentne aplikacije koje kombiniraju shell naredbe s prilagođenim alatima. Prioritizira ispravan odabir i pozivanje alata, smanjujući pogreške kad agenti komuniciraju s vanjskim sustavima. To je relevantno za programere koji grade agente slične GitHub Agentic Workflows, gdje točnost odabira alata izravno utječe na pouzdanost automatizacije.
Unos YouTube URL-a
Programeri mogu proslijediti YouTube URL-ove izravno u promptove. Model analizira video sadržaj, omogućujući radne tokove koji kombiniraju razumijevanje videa s generiranjem koda ili dokumentacije.
Multimodalna Obrada
Gemini 3.1 Pro obrađuje tekst, slike, zvuk, video i kod u jednom kontekstu. S ulaznim prozorom od 1M tokena može obraditi cijele kodne baze ili duge istraživačke dokumente odjednom.
RE-Bench: Performanse u ML Istraživanju
Na RE-Bench, koji procjenjuje sposobnosti ML istraživanja i razvoja, Gemini 3.1 Pro postiže 1.27 (normalizirano prema čovjeku), porast s 1.04 kod Gemini 3 Pro. Model je dovršio zadatke optimizacije u 47 sekundi nasuprot 94-sekundnom ljudskom referentnom vremenu.
Dostupnost Gemini 3.1 Pro
Gemini 3.1 Pro dostupan je u aplikaciji Gemini, Google Cloud Vertex AI, Google AI Studio i Gemini API. Cijene variraju po platformi. Model je u pregledu; opća dostupnost se očekuje naknadno.
Često postavljana pitanja
Što je Gemini 3.1 Pro?
Kako se Gemini 3.1 Pro uspoređuje s Claude Opusom 4.6?
Što je parametar thinking_level u Gemini 3.1 Pro?
Što je endpoint za custom tools u Gemini 3.1 Pro?
Budite u toku
Primajte najnovije AI vijesti na e-mail.
