Gemini 3.1 Pro maatstafresultate
Google DeepMind het Gemini 3.1 Pro op 19 Februarie 2026 vrygestel. Die model het sy voorganger se redenasie-prestasie meer as verdubbel en 77,1% op ARC-AGI-2 behaal teenoor Gemini 3 Pro.
Gemini 3.1 Pro mik op take wat meerstap-redenasie vereis: algoritme-ontwerp, grootskaalse datasintese, agentiese werkvloeie en komplekse kodering.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| Maatstaf | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77,1% | — | — |
| RE-Bench (ML N&O) | 1,27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64,0% |
| Humanity's Last Exam | — | #1 | — |
| Konteks (invoer) | 1M | 200K (1M beta) | 400K |
| Konteks (uitvoer) | 64K | 128K | 128K |
Elke model lei in verskillende gebiede. Gemini 3.1 Pro top nuwe redenasie-maatstawwe. Claude Opus 4.6 lei in agentiese kodering en multidissiplinêre redenasie. GPT-5.2-Codex bied mededingende koderingsprestasie teen laer pryse.
Sleutelfunksies vir ontwikkelaars
Konfigureerbare denkdiepte
Gemini 3.1 Pro stel 'n thinking_level-parameter bekend wat redenasie-diepte beheer. Lae denke is vinnig en goedkoop vir roetine-take. Hoë denke pas meer berekening toe op komplekse probleme.
Dit is soortgelyk aan Claude Opus 4.6 se pogingsbeheerders, hoewel Gemini die instelling as 'n uitdruklike API-parameter blootstel eerder as aanpasbare modelgedrag.
Pasgemaakte gereedskap-eindpunt
'n Aparte eindpunt, gemini-3.1-pro-preview-customtools, is geoptimaliseer vir agentiese toepassings wat skelopdragte met pasgemaakte gereedskap kombineer. Dit prioritiseer korrekte gereedskapskeuse en -aanroeping, wat foute verminder wanneer agente met eksterne stelsels kommunikeer. Dit is relevant vir ontwikkelaars wat agente bou soortgelyk aan GitHub Agentic Workflows, waar gereedskapskeuse-akkuraatheid outomatiseringbetroubaarheid direk beïnvloed.
YouTube URL-invoer
Ontwikkelaars kan YouTube-URL's direk in opdragte deurgee. Die model ontleed video-inhoud, wat werkvloeie moontlik maak wat videobegrip met kodegenerering of dokumentasie kombineer.
Multimodale verwerking
Gemini 3.1 Pro hanteer teks, beelde, klank, video en kode in 'n enkele konteks. Met 'n 1M token invoervenster kan dit hele kodebasse of lang navorsingsdokumente in een slag verwerk.
RE-Bench: ML-navorsingsprestasie
Op RE-Bench, wat ML-navorsings- en -ontwikkelingsvermoëns evalueer, behaal Gemini 3.1 Pro 1,27 (menslik genormaliseer), op van Gemini 3 Pro se 1,04. Die model het optimaliseringstake in 47 sekondes voltooi teenoor die 94-sekonde menslike verwysing.
Gemini 3.1 Pro beskikbaarheid
Gemini 3.1 Pro is beskikbaar in die Gemini-app, Google Cloud Vertex AI, Google AI Studio en die Gemini API. Pryse wissel per platform. Die model is in voorskou; algemene beskikbaarheid word verwag om te volg.
Oorspronklike bron
https://blog.google/technology/google-deepmind/gemini-3-1-pro/Gereelde Vrae
Wat is Gemini 3.1 Pro?
Hoe vergelyk Gemini 3.1 Pro met Claude Opus 4.6?
Wat is die thinking_level-parameter in Gemini 3.1 Pro?
Wat is die pasgemaakte gereedskap-eindpunt in Gemini 3.1 Pro?
Bly op hoogte
Kry die nuutste KI-nuus in jou inkassie.
