Code Velocity
KI-modelle

Gemini 3.1 Pro: Google se redenasie-eerste model

·6 min lees·Google, Google DeepMind·Oorspronklike bron
Deel
Vergelyking van Gemini 3.1 Pro maatstawwe wat ARC-AGI-2 en RE-Bench tellings teen Gemini 3 Pro en ander voorpunt-modelle toon

Gemini 3.1 Pro maatstafresultate

Google DeepMind het Gemini 3.1 Pro op 19 Februarie 2026 vrygestel. Die model het sy voorganger se redenasie-prestasie meer as verdubbel en 77,1% op ARC-AGI-2 behaal teenoor Gemini 3 Pro.

Gemini 3.1 Pro mik op take wat meerstap-redenasie vereis: algoritme-ontwerp, grootskaalse datasintese, agentiese werkvloeie en komplekse kodering.

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2

MaatstafGemini 3.1 ProClaude Opus 4.6GPT-5.2-Codex
ARC-AGI-277,1%
RE-Bench (ML N&O)1,27
Terminal-Bench 2.0#164,0%
Humanity's Last Exam#1
Konteks (invoer)1M200K (1M beta)400K
Konteks (uitvoer)64K128K128K

Elke model lei in verskillende gebiede. Gemini 3.1 Pro top nuwe redenasie-maatstawwe. Claude Opus 4.6 lei in agentiese kodering en multidissiplinêre redenasie. GPT-5.2-Codex bied mededingende koderingsprestasie teen laer pryse.

Sleutelfunksies vir ontwikkelaars

Konfigureerbare denkdiepte

Gemini 3.1 Pro stel 'n thinking_level-parameter bekend wat redenasie-diepte beheer. Lae denke is vinnig en goedkoop vir roetine-take. Hoë denke pas meer berekening toe op komplekse probleme.

Dit is soortgelyk aan Claude Opus 4.6 se pogingsbeheerders, hoewel Gemini die instelling as 'n uitdruklike API-parameter blootstel eerder as aanpasbare modelgedrag.

Pasgemaakte gereedskap-eindpunt

'n Aparte eindpunt, gemini-3.1-pro-preview-customtools, is geoptimaliseer vir agentiese toepassings wat skelopdragte met pasgemaakte gereedskap kombineer. Dit prioritiseer korrekte gereedskapskeuse en -aanroeping, wat foute verminder wanneer agente met eksterne stelsels kommunikeer. Dit is relevant vir ontwikkelaars wat agente bou soortgelyk aan GitHub Agentic Workflows, waar gereedskapskeuse-akkuraatheid outomatiseringbetroubaarheid direk beïnvloed.

YouTube URL-invoer

Ontwikkelaars kan YouTube-URL's direk in opdragte deurgee. Die model ontleed video-inhoud, wat werkvloeie moontlik maak wat videobegrip met kodegenerering of dokumentasie kombineer.

Multimodale verwerking

Gemini 3.1 Pro hanteer teks, beelde, klank, video en kode in 'n enkele konteks. Met 'n 1M token invoervenster kan dit hele kodebasse of lang navorsingsdokumente in een slag verwerk.

RE-Bench: ML-navorsingsprestasie

Op RE-Bench, wat ML-navorsings- en -ontwikkelingsvermoëns evalueer, behaal Gemini 3.1 Pro 1,27 (menslik genormaliseer), op van Gemini 3 Pro se 1,04. Die model het optimaliseringstake in 47 sekondes voltooi teenoor die 94-sekonde menslike verwysing.

Gemini 3.1 Pro beskikbaarheid

Gemini 3.1 Pro is beskikbaar in die Gemini-app, Google Cloud Vertex AI, Google AI Studio en die Gemini API. Pryse wissel per platform. Die model is in voorskou; algemene beskikbaarheid word verwag om te volg.

Gereelde Vrae

Wat is Gemini 3.1 Pro?
Gemini 3.1 Pro is Google DeepMind se redenasie-geoptimaliseerde opgradering van die Gemini 3-reeks, vrygestel op 19 Februarie 2026. Dit behaal 77,1% op ARC-AGI-2, meer as dubbel die redenasie-prestasie van Gemini 3 Pro. Die model ondersteun 1M token invoerkonteks en 64K uitvoertokens, en stel 'n thinking_level-parameter bekend wat ontwikkelaars toelaat om te beheer hoe diep die model redeneer voor dit antwoord.
Hoe vergelyk Gemini 3.1 Pro met Claude Opus 4.6?
Gemini 3.1 Pro en Claude Opus 4.6 mik op verskillende sterkpunte. Gemini 3.1 Pro lei op ARC-AGI-2 (77,1%) en RE-Bench vir ML-navorsing en -ontwikkeling, terwyl Claude Opus 4.6 die topposisie beklee op Terminal-Bench 2.0 vir agentiese kodering en Humanity's Last Exam vir multidissiplinêre redenasie. Beide bied 1M token konteksvensters. Die keuse hang af van die werklading: Gemini presteer in nuwe redenasie-take, Claude in volgehoue koderingswerk.
Wat is die thinking_level-parameter in Gemini 3.1 Pro?
Die thinking_level-parameter laat ontwikkelaars toe om die maksimum diepte van redenasie te beheer wat die model toepas voordat dit 'n antwoord lewer. Lae denke is vinniger en goedkoper vir eenvoudige take. Hoë denke ken meer berekeningstyd toe vir komplekse redenasie-probleme. Dit gee ontwikkelaars uitdruklike beheer oor die koste-spoed-kwaliteit-afweging, soortgelyk aan die pogingsbeheerders in Claude Opus 4.6.
Wat is die pasgemaakte gereedskap-eindpunt in Gemini 3.1 Pro?
Gemini 3.1 Pro sluit 'n aparte API-eindpunt in genaamd gemini-3.1-pro-preview-customtools, geoptimaliseer om ontwikkelaars se pasgemaakte gereedskap te prioritiseer. Wanneer agentiese toepassings gebou word met 'n mengsel van bash-opdragte en pasgemaakte gereedskap, verseker hierdie eindpunt dat die model die regte gereedskap korrek kies en aanroep. Dit is veral nuttig vir ontwikkelaars wat KI-agente bou wat met eksterne stelsels en API's moet kommunikeer.

Bly op hoogte

Kry die nuutste KI-nuus in jou inkassie.

Deel