Code Velocity
AI modeliai

Gemini 3.1 Pro: Google samprotavimui orientuotas modelis

·6 min skaitymo·Google, Google DeepMind·Originalus šaltinis
Dalintis
Gemini 3.1 Pro testų palyginimas, rodantis ARC-AGI-2 ir RE-Bench rezultatus prieš Gemini 3 Pro ir kitus pirmaujančius modelius

Gemini 3.1 Pro testų rezultatai

Google DeepMind išleido Gemini 3.1 Pro 2026 m. vasario 19 d. Modelis daugiau nei dvigubai viršijo pirmtako samprotavimo rezultatą, surinkdamas 77,1 % ARC-AGI-2 lyginant su Gemini 3 Pro.

Gemini 3.1 Pro orientuotas į užduotis, reikalaujančias daugiapakopinio samprotavimo: algoritmų kūrimą, didelio masto duomenų sintezę, agentinius darbo srautus ir sudėtingą kodavimą.

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2

TestasGemini 3.1 ProClaude Opus 4.6GPT-5.2-Codex
ARC-AGI-277,1 %
RE-Bench (ML R&D)1,27
Terminal-Bench 2.0#164,0 %
Humanity's Last Exam#1
Kontekstas (įvestis)1M200K (1M beta)400K
Kontekstas (išvestis)64K128K128K

Kiekvienas modelis pirmauja skirtingose srityse. Gemini 3.1 Pro pirmauja naujuose samprotavimo testuose. Claude Opus 4.6 pirmauja agentiniame kodavime ir tarpdalykiniame samprotavime. GPT-5.2-Codex siūlo konkurencingą kodavimo našumą mažesne kaina.

Pagrindinės funkcijos kūrėjams

Konfigūruojamas mąstymo gylis

Gemini 3.1 Pro pristato thinking_level parametrą, valdantį samprotavimo gylį. Žemas mąstymas yra greitas ir pigus kasdienėms užduotims. Aukštas mąstymas taiko daugiau skaičiavimų sudėtingoms problemoms.

Tai panašu į Claude Opus 4.6 pastangų valdiklius, nors Gemini atskleidžia nustatymą kaip aiškų API parametrą, o ne adaptyvų modelio elgesį.

Pasirinktinių įrankių endpoint

Atskiras endpoint, gemini-3.1-pro-preview-customtools, optimizuotas agentinėms programoms, jungiančioms shell komandas su pasirinktiniais įrankiais. Jis teikia pirmenybę teisingam įrankių pasirinkimui ir iškvietimui, mažindamas klaidas agentams sąveikaujant su išorinėmis sistemomis. Tai aktualu kūrėjams, kuriantiems agentus panašius į GitHub Agentic Workflows, kur įrankių pasirinkimo tikslumas tiesiogiai veikia automatizavimo patikimumą.

YouTube URL įvestis

Kūrėjai gali perduoti YouTube URL tiesiogiai į raginimus. Modelis analizuoja vaizdo turinį, įgalindamas darbo srautus, jungiančius vaizdo supratimą su kodo generavimu ar dokumentacija.

Daugiamodalinis apdorojimas

Gemini 3.1 Pro apdoroja tekstą, vaizdus, garsą, vaizdo įrašus ir kodą viename kontekste. Su 1M žetonų įvesties langu jis gali apdoroti visas kodų bazes ar ilgus mokslinius dokumentus vienu praėjimu.

RE-Bench: ML tyrimų našumas

RE-Bench, kuris vertina ML tyrimų ir plėtros gebėjimus, Gemini 3.1 Pro surinko 1,27 (žmogaus normalizuotas), padidėjimas nuo Gemini 3 Pro 1,04. Modelis atliko optimizavimo užduotis per 47 sekundes, palyginti su 94 sekundžių žmogaus etaloniu.

Gemini 3.1 Pro prieinamumas

Gemini 3.1 Pro pasiekiamas Gemini programoje, Google Cloud Vertex AI, Google AI Studio ir Gemini API. Kainodara priklauso nuo platformos. Modelis yra peržiūros stadijoje; tikimasi, kad bendras prieinamumas pasirodys netrukus.

Dažniausiai užduodami klausimai

Kas yra Gemini 3.1 Pro?
Gemini 3.1 Pro yra Google DeepMind samprotavimui optimizuotas Gemini 3 serijos atnaujinimas, išleistas 2026 m. vasario 19 d. Jis surinko 77,1 % ARC-AGI-2, daugiau nei dvigubai viršydamas Gemini 3 Pro samprotavimo rezultatą. Modelis palaiko 1M žetonų įvesties kontekstą ir 64K išvesties žetonus, taip pat pristato thinking_level parametrą, leidžiantį kūrėjams kontroliuoti, kaip giliai modelis samprotauja prieš atsakydamas.
Kaip Gemini 3.1 Pro lyginamas su Claude Opus 4.6?
Gemini 3.1 Pro ir Claude Opus 4.6 turi skirtingas stipriąsias puses. Gemini 3.1 Pro pirmauja ARC-AGI-2 (77,1 %) ir RE-Bench ML tyrimams ir plėtrai, o Claude Opus 4.6 užima pirmą poziciją Terminal-Bench 2.0 agentiniam kodavimui ir Humanity's Last Exam tarpdalykiniam samprotavimui. Abu siūlo 1M žetonų konteksto langus. Pasirinkimas priklauso nuo darbo krūvio: Gemini puikiai tinka naujoms samprotavimo užduotims, Claude – nuolatiniam kodavimo darbui.
Kas yra thinking_level parametras Gemini 3.1 Pro?
thinking_level parametras leidžia kūrėjams kontroliuoti maksimalų samprotavimo gylį, kurį modelis taiko prieš generuodamas atsakymą. Žemas mąstymas yra greitesnis ir pigesnis paprastoms užduotims. Aukštas mąstymas skiria daugiau skaičiavimo laiko sudėtingoms samprotavimo problemoms. Tai suteikia kūrėjams aiškią kontrolę kainos, greičio ir kokybės kompromiso atžvilgiu, panašiai kaip pastangų valdikliai Claude Opus 4.6.
Kas yra pasirinktinių įrankių endpoint Gemini 3.1 Pro?
Gemini 3.1 Pro apima atskirą API endpoint pavadinimu gemini-3.1-pro-preview-customtools, optimizuotą pirmenybei teikti kūrėjų pasirinktiniams įrankiams. Kuriant agentines programas su bash komandų ir pasirinktinių įrankių mišiniu, šis endpoint užtikrina, kad modelis teisingai pasirenka ir iškviečia reikiamą įrankį. Tai ypač naudinga kūrėjams, kuriantiems AI agentus, kuriems reikia sąveikauti su išorinėmis sistemomis ir API.

Būkite informuoti

Gaukite naujausias AI naujienas el. paštu.

Dalintis