Rezultati meril Gemini 3.1 Pro
Google DeepMind je 19. februarja 2026 izdal Gemini 3.1 Pro. Model več kot podvoji zmogljivost sklepanja svojega predhodnika — dosega 77,1 % na ARC-AGI-2 v primerjavi z Gemini 3 Pro.
Gemini 3.1 Pro cilja naloge, ki zahtevajo večstopenjsko sklepanje: načrtovanje algoritmov, obsežno sintezo podatkov, agentne delovne tokove in zahtevno kodiranje.
Gemini 3.1 Pro proti Claude Opus 4.6 proti GPT-5.2
| Merilo | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77,1 % | — | — |
| RE-Bench (ML R&D) | 1,27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64,0 % |
| Humanity's Last Exam | — | #1 | — |
| Kontekst (vhod) | 1M | 200K (1M beta) | 400K |
| Kontekst (izhod) | 64K | 128K | 128K |
Vsak model vodi na različnih področjih. Gemini 3.1 Pro je na vrhu meril novega sklepanja. Claude Opus 4.6 vodi v agentnem kodiranju in multidisciplinarnem sklepanju. GPT-5.2-Codex ponuja konkurenčno zmogljivost kodiranja po nižji ceni.
Ključne funkcije za razvijalce
Nastavljiva globina razmišljanja
Gemini 3.1 Pro uvaja parameter thinking_level za nadzor globine sklepanja. Nizko razmišljanje je hitro in cenovno ugodno za rutinske naloge. Visoko razmišljanje nameni več računske moči zapletenim problemom.
To je podobno kontrolam napora Claude Opus 4.6, čeprav Gemini nastavitev izpostavlja kot izrecen parameter API namesto prilagodljivega vedenja modela.
Končna točka za orodja po meri
Ločena končna točka, gemini-3.1-pro-preview-customtools, je optimizirana za agentne aplikacije, ki združujejo ukaze lupine z orodji po meri. Prednostno obravnava pravilno izbiro in klic orodij, kar zmanjšuje napake, ko agenti komunicirajo z zunanjimi sistemi. To je relevantno za razvijalce, ki gradijo agente podobne GitHub Agentic Workflows, kjer natančnost izbire orodij neposredno vpliva na zanesljivost avtomatizacije.
Vnos URL-jev YouTube
Razvijalci lahko posredujejo URL-je YouTube neposredno v pozive. Model analizira vsebino videoposnetka, kar omogoča delovne tokove, ki združujejo razumevanje videa z generiranjem kode ali dokumentacije.
Multimodalna obdelava
Gemini 3.1 Pro obdeluje besedilo, slike, zvok, video in kodo v enem kontekstu. Z vhodnim oknom 1M žetonov lahko obdela celotne kodne baze ali dolge raziskovalne dokumente v enem prehodu.
RE-Bench: zmogljivost v raziskavah ML
Na RE-Bench, ki ocenjuje zmogljivosti raziskav in razvoja ML, Gemini 3.1 Pro dosega 1,27 (normalizirano na človeka), v primerjavi z 1,04 pri Gemini 3 Pro. Model je naloge optimizacije zaključil v 47 sekundah v primerjavi s 94-sekundno človeško referenčno vrednostjo.
Razpoložljivost Gemini 3.1 Pro
Gemini 3.1 Pro je na voljo v aplikaciji Gemini, Google Cloud Vertex AI, Google AI Studio in prek API Gemini. Cene se razlikujejo glede na platformo. Model je v predogledu; splošna razpoložljivost se pričakuje kmalu.
Pogosta vprašanja
Kaj je Gemini 3.1 Pro?
Kako se Gemini 3.1 Pro primerja s Claude Opus 4.6?
Kaj je parameter thinking_level v Gemini 3.1 Pro?
Kaj je končna točka za orodja po meri v Gemini 3.1 Pro?
Bodite na tekočem
Prejemajte najnovejše AI novice po e-pošti.
