Gemini 3.1 Pro: rökhugsunarlíkan Google

Gemini 3.1 Pro viðmiðaniðurstöður

Google DeepMind gaf út Gemini 3.1 Pro 19. febrúar 2026. Líkanið meira en tvöfaldaði rökhugsunarafköst forvera síns, og skoraði 77,1% á ARC-AGI-2 á móti Gemini 3 Pro.

Gemini 3.1 Pro miðar á verkefni sem krefjast margra skrefa rökhugunar: algrímshönnun, stórfelld gagnasamsetning, agentic verkflæði og flókin kóðun.

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2

Viðmið	Gemini 3.1 Pro	Claude Opus 4.6	GPT-5.2-Codex
ARC-AGI-2	77,1%	—	—
RE-Bench (ML R&D)	1,27	—	—
Terminal-Bench 2.0	—	#1	64,0%
Humanity's Last Exam	—	#1	—
Samhengi (inntak)	1M	200K (1M beta)	400K
Samhengi (úttak)	64K	128K	128K

Hvert líkan leiðir á ólíkum sviðum. Gemini 3.1 Pro toppar ný rökhugsunarviðmið. Claude Opus 4.6 leiðir í agentic kóðun og þverfaglegri rökhugsun. GPT-5.2-Codex býður samkeppnishæfa kóðunarafköst á lægra verði.

Lykileiginleikar fyrir þróunaraðila

Stillanleg hugsunardjúp

Gemini 3.1 Pro kynnir thinking_level breytu sem stjórnar rökhugsunardjúpinni. Lág hugsun er hröð og ódýr fyrir venjubundin verkefni. Há hugsun beitir meiri útreikningi á flókin vandamál.

Þetta er svipað og álagsbreyturnar í Claude Opus 4.6, þó Gemini afhjúpi stillinguna sem beina API-breytu frekar en aðlögunarhæga líkansbreytni.

Sérsniðna verkfæra-endapunktur

Sérstakur endapunktur, gemini-3.1-pro-preview-customtools, er fínstilltur fyrir agentic forrit sem sameina skel-skipanir og sérsniðin verkfæri. Hann forgangsraðar réttu verkfæravali og -köllun, og dregur úr villum þegar umboðar eiga samskipti við ytri kerfi. Þetta er viðeigandi fyrir þróunaraðila sem byggja umboða líka og GitHub Agentic Workflows, þar sem nákvæmni verkfæravals hefur bein áhrif á sjálfvirkniareiðanleika.

YouTube URL inntak

Þróunaraðilar geta sent YouTube URL beint inn í kvaðningar. Líkanið greinir myndbandsefni, sem gerir verkflæði mögulegt sem sameina myndbandsskilning og kóðaframleiðslu eða skjölun.

Fjölþátta vinnsla

Gemini 3.1 Pro meðhöndlar texta, myndir, hljóð, myndband og kóða í einu samhengi. Með 1M token inntaksglugga getur það unnið heilar kóðabaser eða löng rannsóknarskjöl í einu lagi.

RE-Bench: ML rannsóknaaafköst

Á RE-Bench, sem metur ML rannsóknar- og þróunargetu, skorar Gemini 3.1 Pro 1,27 (mannlega normalisað), upp úr 1,04 hjá Gemini 3 Pro. Líkanið kláraði hagræðingarverkefni á 47 sekúndum á móti 94 sekúndna mannlegri viðmiðun.

Gemini 3.1 Pro aðgengi

Gemini 3.1 Pro er fáanlegt í Gemini appinu, Google Cloud Vertex AI, Google AI Studio og Gemini API. Verðlagning er mismunandi eftir vettvangi. Líkanið er í forsýningu; almenn aðgengi er væntanleg.

Algengar spurningar

Hvað er Gemini 3.1 Pro?

Gemini 3.1 Pro er rökhugsunarbætt uppfærsla á Gemini 3 seríunni frá Google DeepMind, gefin út 19. febrúar 2026. Hún skorar 77,1% á ARC-AGI-2, meira en tvöfalt rökhugsunarafköst Gemini 3 Pro. Líkanið styður 1M token inngangssamhengi og 64K úttakstokena, og kynnir thinking_level breytu sem leyfir þróunaraðilum að stjórna hversu djúpt líkanið rökhugar áður en það svarar.

Hvernig er Gemini 3.1 Pro samanborið við Claude Opus 4.6?

Gemini 3.1 Pro og Claude Opus 4.6 miða á ólíka styrkleika. Gemini 3.1 Pro leiðir á ARC-AGI-2 (77,1%) og RE-Bench fyrir ML rannsóknir, á meðan Claude Opus 4.6 hefur efsta sæti á Terminal-Bench 2.0 fyrir agentic kóðun og Humanity's Last Exam fyrir þverfaglega rökhugsun. Bæði bjóða 1M token samhengisglugga. Valið fer eftir vinnuálagi: Gemini skarar úr í nýjum rökhugsunarverkefnum, Claude í viðvarandi kóðunarvinnu.

Hvað er thinking_level breytan í Gemini 3.1 Pro?

thinking_level breytan leyfir þróunaraðilum að stjórna hámarksdjúp rökhugunar sem líkanið beitir áður en það framleiðir svar. Lág hugsun er hraðari og ódýrari fyrir einfaldar aðgerðir. Há hugsun úthlutar meiri reikningstíma fyrir flókin rökhugsunarverkefni. Þetta gefur þróunaraðilum beinan stjórnun á kostnaði-hraða-gæða jafnvæginu, svipað og álagsbreyturnar í Claude Opus 4.6.

Hvað er sérsniðna verkfæra-endapunkturinn í Gemini 3.1 Pro?

Gemini 3.1 Pro felur í sér sérstakan API endapunkt sem heitir gemini-3.1-pro-preview-customtools, fínstilltan til að forgangsraða sérsniðnum verkfærum þróunaraðila. Þegar agentic forrit eru byggð með blöndu af bash skipunum og sérsniðnum verkfærum, tryggir þessi endapunktur að líkanið velji og kalli á rétt verkfæri. Þetta er sérstaklega gagnlegt fyrir þróunaraðila sem byggja gervigreindarumboða sem þurfa að eiga samskipti við ytri kerfi og API.