Gemini 3.1 Pro viðmiðaniðurstöður
Google DeepMind gaf út Gemini 3.1 Pro 19. febrúar 2026. Líkanið meira en tvöfaldaði rökhugsunarafköst forvera síns, og skoraði 77,1% á ARC-AGI-2 á móti Gemini 3 Pro.
Gemini 3.1 Pro miðar á verkefni sem krefjast margra skrefa rökhugunar: algrímshönnun, stórfelld gagnasamsetning, agentic verkflæði og flókin kóðun.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| Viðmið | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77,1% | — | — |
| RE-Bench (ML R&D) | 1,27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64,0% |
| Humanity's Last Exam | — | #1 | — |
| Samhengi (inntak) | 1M | 200K (1M beta) | 400K |
| Samhengi (úttak) | 64K | 128K | 128K |
Hvert líkan leiðir á ólíkum sviðum. Gemini 3.1 Pro toppar ný rökhugsunarviðmið. Claude Opus 4.6 leiðir í agentic kóðun og þverfaglegri rökhugsun. GPT-5.2-Codex býður samkeppnishæfa kóðunarafköst á lægra verði.
Lykileiginleikar fyrir þróunaraðila
Stillanleg hugsunardjúp
Gemini 3.1 Pro kynnir thinking_level breytu sem stjórnar rökhugsunardjúpinni. Lág hugsun er hröð og ódýr fyrir venjubundin verkefni. Há hugsun beitir meiri útreikningi á flókin vandamál.
Þetta er svipað og álagsbreyturnar í Claude Opus 4.6, þó Gemini afhjúpi stillinguna sem beina API-breytu frekar en aðlögunarhæga líkansbreytni.
Sérsniðna verkfæra-endapunktur
Sérstakur endapunktur, gemini-3.1-pro-preview-customtools, er fínstilltur fyrir agentic forrit sem sameina skel-skipanir og sérsniðin verkfæri. Hann forgangsraðar réttu verkfæravali og -köllun, og dregur úr villum þegar umboðar eiga samskipti við ytri kerfi. Þetta er viðeigandi fyrir þróunaraðila sem byggja umboða líka og GitHub Agentic Workflows, þar sem nákvæmni verkfæravals hefur bein áhrif á sjálfvirkniareiðanleika.
YouTube URL inntak
Þróunaraðilar geta sent YouTube URL beint inn í kvaðningar. Líkanið greinir myndbandsefni, sem gerir verkflæði mögulegt sem sameina myndbandsskilning og kóðaframleiðslu eða skjölun.
Fjölþátta vinnsla
Gemini 3.1 Pro meðhöndlar texta, myndir, hljóð, myndband og kóða í einu samhengi. Með 1M token inntaksglugga getur það unnið heilar kóðabaser eða löng rannsóknarskjöl í einu lagi.
RE-Bench: ML rannsóknaaafköst
Á RE-Bench, sem metur ML rannsóknar- og þróunargetu, skorar Gemini 3.1 Pro 1,27 (mannlega normalisað), upp úr 1,04 hjá Gemini 3 Pro. Líkanið kláraði hagræðingarverkefni á 47 sekúndum á móti 94 sekúndna mannlegri viðmiðun.
Gemini 3.1 Pro aðgengi
Gemini 3.1 Pro er fáanlegt í Gemini appinu, Google Cloud Vertex AI, Google AI Studio og Gemini API. Verðlagning er mismunandi eftir vettvangi. Líkanið er í forsýningu; almenn aðgengi er væntanleg.
Upprunaleg heimild
https://blog.google/technology/google-deepmind/gemini-3-1-pro/Algengar spurningar
Hvað er Gemini 3.1 Pro?
Hvernig er Gemini 3.1 Pro samanborið við Claude Opus 4.6?
Hvað er thinking_level breytan í Gemini 3.1 Pro?
Hvað er sérsniðna verkfæra-endapunkturinn í Gemini 3.1 Pro?
Fylgstu með
Fáðu nýjustu gervigreindarfréttirnar í pósthólfið.
