Code Velocity
Tekoälymallit

Gemini 3.1 Pro: Googlen päättelypainotteinen malli

·6 min lukuaika·Google, Google DeepMind·Alkuperäinen lähde
Jaa
Gemini 3.1 Pron suorituskykytestivertailu, jossa näkyvät ARC-AGI-2- ja RE-Bench-tulokset verrattuna Gemini 3 Prohon ja muihin eturintaman malleihin

Gemini 3.1 Pron suorituskykytulokset

Google DeepMind julkaisi Gemini 3.1 Pron 19. helmikuuta 2026. Malli yli tuplaa edeltäjänsä päättelysuorituskyvyn saaden 77,1 % ARC-AGI-2:ssa verrattuna Gemini 3 Prohon.

Gemini 3.1 Pro kohdistuu tehtäviin, jotka vaativat monivaiheista päättelyä: algoritmien suunnittelu, laajamittainen datan syntetisointi, agenttiset työnkulut ja monimutkainen koodaus.

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2

SuorituskykytestiGemini 3.1 ProClaude Opus 4.6GPT-5.2-Codex
ARC-AGI-277,1 %
RE-Bench (koneoppimistutkimus)1,27
Terminal-Bench 2.0#164,0 %
Humanity's Last Exam#1
Konteksti (syöte)1M200K (1M beta)400K
Konteksti (tuloste)64K128K128K

Jokainen malli johtaa eri alueilla. Gemini 3.1 Pro on kärjessä uudentyyppisissä päättelysuorituskykytesteissä. Claude Opus 4.6 johtaa agenttisessa koodauksessa ja monitieteisessä päättelyssä. GPT-5.2-Codex tarjoaa kilpailukykyistä koodaussuorituskykyä edullisemmalla hinnoittelulla.

Keskeiset ominaisuudet kehittäjille

Säädettävä ajattelun syvyys

Gemini 3.1 Pro esittelee thinking_level-parametrin päättelysyvyyden säätämiseen. Matala ajattelu on nopeaa ja edullista rutinitehtäviin. Korkea ajattelu soveltaa enemmän laskentaa monimutkaisiin ongelmiin.

Tämä on samankaltaista kuin Claude Opus 4.6:n panostuksen säädöt, vaikka Gemini paljastaa asetuksen nimenomaisena API-parametrina adaptiivisen mallikäyttäytymisen sijaan.

Räätälöityjen työkalujen rajapinta

Erillinen rajapinta, gemini-3.1-pro-preview-customtools, on optimoitu agenttisille sovelluksille, jotka yhdistävät komentorivikomennot räätälöityihin työkaluihin. Se priorisoi oikean työkalun valinnan ja kutsumisen, vähentäen virheitä agenttien vuorovaikuttaessa ulkoisten järjestelmien kanssa. Tämä on relevanttia kehittäjille, jotka rakentavat GitHub Agentic Workflowsin kaltaisia agentteja, joissa työkalun valinnan tarkkuus vaikuttaa suoraan automaation luotettavuuteen.

YouTube-URL-syöte

Kehittäjät voivat syöttää YouTube-URL:eja suoraan kehotteisiin. Malli analysoi videosisältöä, mahdollistaen työnkulut, jotka yhdistävät videon ymmärryksen koodin generointiin tai dokumentaatioon.

Monimodaalinen käsittely

Gemini 3.1 Pro käsittelee tekstiä, kuvia, ääntä, videota ja koodia yhdessä kontekstissa. 1M tokenin syöteikkunalla se voi käsitellä kokonaisia koodikantoja tai pitkiä tutkimusdokumentteja yhdellä kerralla.

RE-Bench: Koneoppimistutkimuksen suorituskyky

RE-Benchissä, joka arvioi koneoppimisen tutkimus- ja kehityskykyjä, Gemini 3.1 Pro saa 1,27 (ihmisnormalisoitu), ylittäen Gemini 3 Pron 1,04. Malli suoritti optimointitehtävät 47 sekunnissa verrattuna ihmisten 94 sekunnin viiteaikaan.

Gemini 3.1 Pron saatavuus

Gemini 3.1 Pro on saatavilla Gemini-sovelluksessa, Google Cloud Vertex AI:ssa, Google AI Studiossa ja Gemini API:ssa. Hinnoittelu vaihtelee alustasta riippuen. Malli on esikatselussa; yleinen saatavuus odotetaan myöhemmin.

Usein kysytyt kysymykset

Mikä on Gemini 3.1 Pro?
Gemini 3.1 Pro on Google DeepMindin päättelyyn optimoitu päivitys Gemini 3 -sarjaan, julkaistu 19. helmikuuta 2026. Se saa 77,1 % ARC-AGI-2:ssa, yli tuplaaten Gemini 3 Pron päättelysuorituskyvyn. Malli tukee 1M tokenin syötekontekstia ja 64K tulostetokenia, ja esittelee thinking_level-parametrin, jolla kehittäjät voivat säätää mallin päättelysyvyyttä ennen vastausta.
Miten Gemini 3.1 Pro vertautuu Claude Opus 4.6:een?
Gemini 3.1 Pro ja Claude Opus 4.6 kohdistuvat eri vahvuuksiin. Gemini 3.1 Pro johtaa ARC-AGI-2:ssa (77,1 %) ja RE-Benchissä koneoppimistutkimuksessa, kun taas Claude Opus 4.6 pitää kärkipaikkaa Terminal-Bench 2.0:ssa agenttisessa koodauksessa ja Humanity's Last Exam:issa monitieteisessä päättelyssä. Molemmat tarjoavat 1M tokenin konteksti-ikkunat. Valinta riippuu työkuormasta: Gemini loistaa uudentyyppisissä päättelytehtävissä, Claude pitkäkestoisessa koodaustyössä.
Mikä on thinking_level-parametri Gemini 3.1 Prossa?
thinking_level-parametri antaa kehittäjien säätää mallin maksimaalista päättelysyvyyttä ennen vastauksen tuottamista. Matala ajattelu on nopeampaa ja edullisempaa suoraviivaisiin tehtäviin. Korkea ajattelu varaa enemmän laskenta-aikaa monimutkaisiin päättelyongelmiin. Tämä antaa kehittäjille nimenomaisen hallinnan kustannus-nopeus-laatu-tasapainoon, samaan tapaan kuin Claude Opus 4.6:n panostuksen säädöt.
Mikä on räätälöityjen työkalujen rajapinta Gemini 3.1 Prossa?
Gemini 3.1 Pro sisältää erillisen API-rajapinnan nimeltä gemini-3.1-pro-preview-customtools, joka on optimoitu priorisoimaan räätälöityjä kehittäjätyökaluja. Kun rakennetaan agenttisia sovelluksia, joissa yhdistyvät komentorivikomennot ja räätälöidyt työkalut, tämä rajapinta varmistaa, että malli valitsee ja kutsuu oikean työkalun. Tämä on erityisen hyödyllistä kehittäjille, jotka rakentavat tekoälyagentteja, joiden tarvitsee vuorovaikuttaa ulkoisten järjestelmien ja API:en kanssa.

Pysy ajan tasalla

Saa uusimmat tekoälyuutiset sähköpostiisi.

Jaa