Gemini 3.1 Pron suorituskykytulokset
Google DeepMind julkaisi Gemini 3.1 Pron 19. helmikuuta 2026. Malli yli tuplaa edeltäjänsä päättelysuorituskyvyn saaden 77,1 % ARC-AGI-2:ssa verrattuna Gemini 3 Prohon.
Gemini 3.1 Pro kohdistuu tehtäviin, jotka vaativat monivaiheista päättelyä: algoritmien suunnittelu, laajamittainen datan syntetisointi, agenttiset työnkulut ja monimutkainen koodaus.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| Suorituskykytesti | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77,1 % | — | — |
| RE-Bench (koneoppimistutkimus) | 1,27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64,0 % |
| Humanity's Last Exam | — | #1 | — |
| Konteksti (syöte) | 1M | 200K (1M beta) | 400K |
| Konteksti (tuloste) | 64K | 128K | 128K |
Jokainen malli johtaa eri alueilla. Gemini 3.1 Pro on kärjessä uudentyyppisissä päättelysuorituskykytesteissä. Claude Opus 4.6 johtaa agenttisessa koodauksessa ja monitieteisessä päättelyssä. GPT-5.2-Codex tarjoaa kilpailukykyistä koodaussuorituskykyä edullisemmalla hinnoittelulla.
Keskeiset ominaisuudet kehittäjille
Säädettävä ajattelun syvyys
Gemini 3.1 Pro esittelee thinking_level-parametrin päättelysyvyyden säätämiseen. Matala ajattelu on nopeaa ja edullista rutinitehtäviin. Korkea ajattelu soveltaa enemmän laskentaa monimutkaisiin ongelmiin.
Tämä on samankaltaista kuin Claude Opus 4.6:n panostuksen säädöt, vaikka Gemini paljastaa asetuksen nimenomaisena API-parametrina adaptiivisen mallikäyttäytymisen sijaan.
Räätälöityjen työkalujen rajapinta
Erillinen rajapinta, gemini-3.1-pro-preview-customtools, on optimoitu agenttisille sovelluksille, jotka yhdistävät komentorivikomennot räätälöityihin työkaluihin. Se priorisoi oikean työkalun valinnan ja kutsumisen, vähentäen virheitä agenttien vuorovaikuttaessa ulkoisten järjestelmien kanssa. Tämä on relevanttia kehittäjille, jotka rakentavat GitHub Agentic Workflowsin kaltaisia agentteja, joissa työkalun valinnan tarkkuus vaikuttaa suoraan automaation luotettavuuteen.
YouTube-URL-syöte
Kehittäjät voivat syöttää YouTube-URL:eja suoraan kehotteisiin. Malli analysoi videosisältöä, mahdollistaen työnkulut, jotka yhdistävät videon ymmärryksen koodin generointiin tai dokumentaatioon.
Monimodaalinen käsittely
Gemini 3.1 Pro käsittelee tekstiä, kuvia, ääntä, videota ja koodia yhdessä kontekstissa. 1M tokenin syöteikkunalla se voi käsitellä kokonaisia koodikantoja tai pitkiä tutkimusdokumentteja yhdellä kerralla.
RE-Bench: Koneoppimistutkimuksen suorituskyky
RE-Benchissä, joka arvioi koneoppimisen tutkimus- ja kehityskykyjä, Gemini 3.1 Pro saa 1,27 (ihmisnormalisoitu), ylittäen Gemini 3 Pron 1,04. Malli suoritti optimointitehtävät 47 sekunnissa verrattuna ihmisten 94 sekunnin viiteaikaan.
Gemini 3.1 Pron saatavuus
Gemini 3.1 Pro on saatavilla Gemini-sovelluksessa, Google Cloud Vertex AI:ssa, Google AI Studiossa ja Gemini API:ssa. Hinnoittelu vaihtelee alustasta riippuen. Malli on esikatselussa; yleinen saatavuus odotetaan myöhemmin.
Alkuperäinen lähde
https://blog.google/technology/google-deepmind/gemini-3-1-pro/Usein kysytyt kysymykset
Mikä on Gemini 3.1 Pro?
Miten Gemini 3.1 Pro vertautuu Claude Opus 4.6:een?
Mikä on thinking_level-parametri Gemini 3.1 Prossa?
Mikä on räätälöityjen työkalujen rajapinta Gemini 3.1 Prossa?
Pysy ajan tasalla
Saa uusimmat tekoälyuutiset sähköpostiisi.
