Gemini 3.1 Pro võrdlustestide tulemused
Google DeepMind avaldas Gemini 3.1 Pro 19. veebruaril 2026. Mudel rohkem kui kahekordistab oma eelkäija mõtlemisjõudlust, saavutades 77,1% ARC-AGI-2 testis võrreldes Gemini 3 Pro-ga.
Gemini 3.1 Pro sihib ülesandeid, mis nõuavad mitmeetapilist mõtlemist: algoritmide kujundamine, suuremahuline andmete süntees, agentsed töövood ja keerukas kodeerimine.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| Võrdlustest | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77,1% | — | — |
| RE-Bench (ML R&D) | 1,27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64,0% |
| Humanity's Last Exam | — | #1 | — |
| Kontekst (sisend) | 1M | 200K (1M beeta) | 400K |
| Kontekst (väljund) | 64K | 128K | 128K |
Iga mudel juhib erinevates valdkondades. Gemini 3.1 Pro paistab silma uudsetes mõtlemise võrdlustestides. Claude Opus 4.6 juhib agentset kodeerimist ja multidistsiplinaarset mõtlemist. GPT-5.2-Codex pakub konkurentsivõimelist kodeerimise jõudlust madalama hinnaga.
Põhifunktsioonid arendajatele
Seadistatav mõtlemissügavus
Gemini 3.1 Pro tutvustab thinking_level parameetrit mõtlemissügavuse kontrollimiseks. Madal thinking on kiire ja odav rutiinsete ülesannete jaoks. Kõrge thinking rakendab rohkem arvutusvõimsust keerukate probleemide jaoks.
See on kontseptuaalselt sarnane Claude Opus 4.6 jõupingutuse kontrollidele, kuigi Gemini avab seade otsese API parameetrina, mitte kohanduva mudelikäitumisena.
Custom tools lõpp-punkt
Eraldi lõpp-punkt gemini-3.1-pro-preview-customtools on optimeeritud agentsete rakenduste jaoks, mis ühendavad shell käske kohandatud tööriistadega. See prioritiseerib õiget tööriista valikut ja käivitamist, vähendades vigu, kui agendid suhtlevad väliste süsteemidega. See on oluline arendajatele, kes ehitavad agente sarnaselt GitHub Agentic Workflows'ile, kus tööriista valiku täpsus mõjutab otseselt automatiseerimise usaldusväärsust.
YouTube URL sisend
Arendajad saavad edastada YouTube URL-e otse päringutesse. Mudel analüüsib videosisu, võimaldades töövooge, mis ühendavad videoarusaamist koodi genereerimise või dokumentatsiooniga.
Multimodaalne töötlus
Gemini 3.1 Pro käsitleb teksti, pilte, heli, videot ja koodi ühtses kontekstis. 1M tokeniga sisendaknaga suudab see töödelda terveid koodibaase või pikki uurimisdokumente ühe korraga.
RE-Bench: ML uurimisjõudlus
RE-Bench testis, mis hindab ML uurimis- ja arendusvõimekusi, saavutab Gemini 3.1 Pro inimesega normaliseeritud skoori 1,27, tõustes Gemini 3 Pro 1,04 tulemuselt. Mudel lõpetas optimeerimisülesanded 47 sekundiga võrreldes inimeste 94-sekundilise viitega.
Gemini 3.1 Pro saadavus
Gemini 3.1 Pro on saadaval Gemini rakenduses, Google Cloud Vertex AI-s, Google AI Studios ja Gemini API-s. Hinnad varieeruvad platvormi kaupa. Mudel on eelvaates; üldine kättesaadavus peaks peagi järgnema.
Korduma kippuvad küsimused
Mis on Gemini 3.1 Pro?
Kuidas Gemini 3.1 Pro võrdleb Claude Opus 4.6-ga?
Mis on thinking_level parameeter Gemini 3.1 Pro-s?
Mis on custom tools endpoint Gemini 3.1 Pro-s?
Püsige kursis
Saage värskeimad AI uudised oma postkasti.
