Code Velocity
Tehisintellekti mudelid

Gemini 3.1 Pro: Google'i mõtlemisele orienteeritud mudel

·6 min lugemist·Google, Google DeepMind·Algallikas
Jaga
Gemini 3.1 Pro võrdlustestide võrdlus, mis näitab ARC-AGI-2 ja RE-Bench tulemusi Gemini 3 Pro ja teiste eesliinimudelite vastu

Gemini 3.1 Pro võrdlustestide tulemused

Google DeepMind avaldas Gemini 3.1 Pro 19. veebruaril 2026. Mudel rohkem kui kahekordistab oma eelkäija mõtlemisjõudlust, saavutades 77,1% ARC-AGI-2 testis võrreldes Gemini 3 Pro-ga.

Gemini 3.1 Pro sihib ülesandeid, mis nõuavad mitmeetapilist mõtlemist: algoritmide kujundamine, suuremahuline andmete süntees, agentsed töövood ja keerukas kodeerimine.

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2

VõrdlustestGemini 3.1 ProClaude Opus 4.6GPT-5.2-Codex
ARC-AGI-277,1%
RE-Bench (ML R&D)1,27
Terminal-Bench 2.0#164,0%
Humanity's Last Exam#1
Kontekst (sisend)1M200K (1M beeta)400K
Kontekst (väljund)64K128K128K

Iga mudel juhib erinevates valdkondades. Gemini 3.1 Pro paistab silma uudsetes mõtlemise võrdlustestides. Claude Opus 4.6 juhib agentset kodeerimist ja multidistsiplinaarset mõtlemist. GPT-5.2-Codex pakub konkurentsivõimelist kodeerimise jõudlust madalama hinnaga.

Põhifunktsioonid arendajatele

Seadistatav mõtlemissügavus

Gemini 3.1 Pro tutvustab thinking_level parameetrit mõtlemissügavuse kontrollimiseks. Madal thinking on kiire ja odav rutiinsete ülesannete jaoks. Kõrge thinking rakendab rohkem arvutusvõimsust keerukate probleemide jaoks.

See on kontseptuaalselt sarnane Claude Opus 4.6 jõupingutuse kontrollidele, kuigi Gemini avab seade otsese API parameetrina, mitte kohanduva mudelikäitumisena.

Custom tools lõpp-punkt

Eraldi lõpp-punkt gemini-3.1-pro-preview-customtools on optimeeritud agentsete rakenduste jaoks, mis ühendavad shell käske kohandatud tööriistadega. See prioritiseerib õiget tööriista valikut ja käivitamist, vähendades vigu, kui agendid suhtlevad väliste süsteemidega. See on oluline arendajatele, kes ehitavad agente sarnaselt GitHub Agentic Workflows'ile, kus tööriista valiku täpsus mõjutab otseselt automatiseerimise usaldusväärsust.

YouTube URL sisend

Arendajad saavad edastada YouTube URL-e otse päringutesse. Mudel analüüsib videosisu, võimaldades töövooge, mis ühendavad videoarusaamist koodi genereerimise või dokumentatsiooniga.

Multimodaalne töötlus

Gemini 3.1 Pro käsitleb teksti, pilte, heli, videot ja koodi ühtses kontekstis. 1M tokeniga sisendaknaga suudab see töödelda terveid koodibaase või pikki uurimisdokumente ühe korraga.

RE-Bench: ML uurimisjõudlus

RE-Bench testis, mis hindab ML uurimis- ja arendusvõimekusi, saavutab Gemini 3.1 Pro inimesega normaliseeritud skoori 1,27, tõustes Gemini 3 Pro 1,04 tulemuselt. Mudel lõpetas optimeerimisülesanded 47 sekundiga võrreldes inimeste 94-sekundilise viitega.

Gemini 3.1 Pro saadavus

Gemini 3.1 Pro on saadaval Gemini rakenduses, Google Cloud Vertex AI-s, Google AI Studios ja Gemini API-s. Hinnad varieeruvad platvormi kaupa. Mudel on eelvaates; üldine kättesaadavus peaks peagi järgnema.

Korduma kippuvad küsimused

Mis on Gemini 3.1 Pro?
Gemini 3.1 Pro on Google DeepMindi mõtlemisele optimeeritud uuendus Gemini 3 seeriale, mis avaldati 19. veebruaril 2026. See saavutab 77,1% ARC-AGI-2 testis, rohkem kui kahekordistades Gemini 3 Pro mõtlemisjõudlust. Mudel toetab 1M tokeniga sisendkonteksti ja 64K väljundtokeneid ning tutvustab thinking_level parameetrit, mis laseb arendajatel kontrollida, kui sügavalt mudel enne vastamist mõtleb.
Kuidas Gemini 3.1 Pro võrdleb Claude Opus 4.6-ga?
Gemini 3.1 Pro ja Claude Opus 4.6 sihivad erinevaid tugevusi. Gemini 3.1 Pro juhib ARC-AGI-2 (77,1%) ja RE-Bench ML R&D testides, samas kui Claude Opus 4.6 hoiab #1 kohta Terminal-Bench 2.0 agentseks kodeerimiseks ja Humanity's Last Exam multidistsiplinaarseks mõtlemiseks. Mõlemal on 1M tokeniga kontekstiaknaid. Valik sõltub töökoormuse tüübist: Gemini paistab silma uudsetes mõtlemisülesannetes, Claude püsivas kodeerimistöös.
Mis on thinking_level parameeter Gemini 3.1 Pro-s?
Thinking_level parameeter laseb arendajatel kontrollida maksimaalset mõtlemissügavust, mida mudel enne vastuse andmist rakendab. Madal thinking on kiirem ja odavam lihtsate ülesannete jaoks. Kõrge thinking eraldab rohkem arvutusaega keerukate mõtlemisprobleemide jaoks. See annab arendajatele otsese kontrolli hinna-kiiruse-kvaliteedi tasakaalu üle, sarnaselt Claude Opus 4.6 jõupingutuse kontrollidele.
Mis on custom tools endpoint Gemini 3.1 Pro-s?
Gemini 3.1 Pro sisaldab eraldi API lõpp-punkti nimega gemini-3.1-pro-preview-customtools, mis on optimeeritud kohandatud arendajatööriistade prioritiseerimiseks. Agentsete rakenduste ehitamisel, mis kasutavad bash käske ja kohandatud tööriistu, tagab see lõpp-punkt mudeli õige tööriista valiku ja käivitamise. See on eriti kasulik arendajatele, kes ehitavad AI agente, mis vajavad suhtlust väliste süsteemide ja API-dega.

Püsige kursis

Saage värskeimad AI uudised oma postkasti.

Jaga