Gemini 3.1 Pro testų rezultatai
Google DeepMind išleido Gemini 3.1 Pro 2026 m. vasario 19 d. Modelis daugiau nei dvigubai viršijo pirmtako samprotavimo rezultatą, surinkdamas 77,1 % ARC-AGI-2 lyginant su Gemini 3 Pro.
Gemini 3.1 Pro orientuotas į užduotis, reikalaujančias daugiapakopinio samprotavimo: algoritmų kūrimą, didelio masto duomenų sintezę, agentinius darbo srautus ir sudėtingą kodavimą.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| Testas | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77,1 % | — | — |
| RE-Bench (ML R&D) | 1,27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64,0 % |
| Humanity's Last Exam | — | #1 | — |
| Kontekstas (įvestis) | 1M | 200K (1M beta) | 400K |
| Kontekstas (išvestis) | 64K | 128K | 128K |
Kiekvienas modelis pirmauja skirtingose srityse. Gemini 3.1 Pro pirmauja naujuose samprotavimo testuose. Claude Opus 4.6 pirmauja agentiniame kodavime ir tarpdalykiniame samprotavime. GPT-5.2-Codex siūlo konkurencingą kodavimo našumą mažesne kaina.
Pagrindinės funkcijos kūrėjams
Konfigūruojamas mąstymo gylis
Gemini 3.1 Pro pristato thinking_level parametrą, valdantį samprotavimo gylį. Žemas mąstymas yra greitas ir pigus kasdienėms užduotims. Aukštas mąstymas taiko daugiau skaičiavimų sudėtingoms problemoms.
Tai panašu į Claude Opus 4.6 pastangų valdiklius, nors Gemini atskleidžia nustatymą kaip aiškų API parametrą, o ne adaptyvų modelio elgesį.
Pasirinktinių įrankių endpoint
Atskiras endpoint, gemini-3.1-pro-preview-customtools, optimizuotas agentinėms programoms, jungiančioms shell komandas su pasirinktiniais įrankiais. Jis teikia pirmenybę teisingam įrankių pasirinkimui ir iškvietimui, mažindamas klaidas agentams sąveikaujant su išorinėmis sistemomis. Tai aktualu kūrėjams, kuriantiems agentus panašius į GitHub Agentic Workflows, kur įrankių pasirinkimo tikslumas tiesiogiai veikia automatizavimo patikimumą.
YouTube URL įvestis
Kūrėjai gali perduoti YouTube URL tiesiogiai į raginimus. Modelis analizuoja vaizdo turinį, įgalindamas darbo srautus, jungiančius vaizdo supratimą su kodo generavimu ar dokumentacija.
Daugiamodalinis apdorojimas
Gemini 3.1 Pro apdoroja tekstą, vaizdus, garsą, vaizdo įrašus ir kodą viename kontekste. Su 1M žetonų įvesties langu jis gali apdoroti visas kodų bazes ar ilgus mokslinius dokumentus vienu praėjimu.
RE-Bench: ML tyrimų našumas
RE-Bench, kuris vertina ML tyrimų ir plėtros gebėjimus, Gemini 3.1 Pro surinko 1,27 (žmogaus normalizuotas), padidėjimas nuo Gemini 3 Pro 1,04. Modelis atliko optimizavimo užduotis per 47 sekundes, palyginti su 94 sekundžių žmogaus etaloniu.
Gemini 3.1 Pro prieinamumas
Gemini 3.1 Pro pasiekiamas Gemini programoje, Google Cloud Vertex AI, Google AI Studio ir Gemini API. Kainodara priklauso nuo platformos. Modelis yra peržiūros stadijoje; tikimasi, kad bendras prieinamumas pasirodys netrukus.
Originalus šaltinis
https://blog.google/technology/google-deepmind/gemini-3-1-pro/Dažniausiai užduodami klausimai
Kas yra Gemini 3.1 Pro?
Kaip Gemini 3.1 Pro lyginamas su Claude Opus 4.6?
Kas yra thinking_level parametras Gemini 3.1 Pro?
Kas yra pasirinktinių įrankių endpoint Gemini 3.1 Pro?
Būkite informuoti
Gaukite naujausias AI naujienas el. paštu.
