Gemini 3.1 Pro etalontesta rezultāti
Google DeepMind izlaida Gemini 3.1 Pro 2026. gada 19. februārī. Modelis vairāk nekā divkāršo sava priekšteča domāšanas veiktspēju, sasniedzot 77,1% ARC-AGI-2 salīdzinājumā ar Gemini 3 Pro.
Gemini 3.1 Pro mērķē uz uzdevumiem, kam nepieciešama daudzsoļu domāšana: algoritmu projektēšana, liela mēroga datu sintēze, agenturālās darba plūsmas un sarežģīta kodēšana.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| Etalontests | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77,1% | — | — |
| RE-Bench (ML R&D) | 1,27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64,0% |
| Humanity's Last Exam | — | #1 | — |
| Konteksts (ievade) | 1M | 200K (1M beta) | 400K |
| Konteksts (izvade) | 64K | 128K | 128K |
Katrs modelis vada dažādās jomās. Gemini 3.1 Pro izceļas jaunos domāšanas etalontestos. Claude Opus 4.6 vada agenturālo kodēšanu un multidisciplināro domāšanu. GPT-5.2-Codex piedāvā konkurētspējīgu kodēšanas veiktspēju par zemāku cenu.
Galvenās funkcijas izstrādātājiem
Konfigurējams domāšanas dziļums
Gemini 3.1 Pro ievieš thinking_level parametru domāšanas dziļuma kontrolei. Zems thinking ir ātrs un lēts rutīnas uzdevumiem. Augsts thinking piešķir vairāk skaitļošanas sarežģītām problēmām.
Konceptuāli līdzīgs Claude Opus 4.6 piepūles vadīklām, lai gan Gemini atklāj iestatījumu kā tiešu API parametru, nevis adaptīvu modeļa uzvedību.
Custom tools galapunkts
Atsevišķs galapunkts gemini-3.1-pro-preview-customtools ir optimizēts agenturālām lietojumprogrammām, kas apvieno čaulas komandas ar pielāgotiem rīkiem. Tas prioritizē pareizu rīka izvēli un izsaukšanu, samazinot kļūdas, kad aģenti sadarbojas ar ārējām sistēmām. Tas ir nozīmīgi izstrādātājiem, kas veido aģentus līdzīgi GitHub Agentic Workflows, kur rīka izvēles precizitāte tieši ietekmē automatizācijas uzticamību.
YouTube URL ievade
Izstrādātāji var nodot YouTube URL tieši vaicājumos. Modelis analizē video saturu, ļaujot darba plūsmām apvienot video izpratni ar koda ģenerēšanu vai dokumentāciju.
Multimodāla apstrāde
Gemini 3.1 Pro apstrādā tekstu, attēlus, audio, video un kodu vienā kontekstā. Ar 1M tokenu ievades logu tas var apstrādāt veselas kodu bāzes vai garus pētniecības dokumentus vienā piegājienā.
RE-Bench: ML pētniecības veiktspēja
RE-Bench, kas novērtē ML pētniecības un izstrādes spējas, Gemini 3.1 Pro sasniedz cilvēka normalizētu rezultātu 1,27, palielinoties no Gemini 3 Pro 1,04. Modelis pabeidza optimizācijas uzdevumus 47 sekundēs salīdzinājumā ar cilvēku 94 sekunžu atsauci.
Gemini 3.1 Pro pieejamība
Gemini 3.1 Pro ir pieejams Gemini lietotnē, Google Cloud Vertex AI, Google AI Studio un Gemini API. Cenas atšķiras pa platformām. Modelis ir priekšskatījumā; vispārēja pieejamība sagaidāma drīzumā.
Sākotnējais avots
https://blog.google/technology/google-deepmind/gemini-3-1-pro/Bieži uzdotie jautājumi
Kas ir Gemini 3.1 Pro?
Kā Gemini 3.1 Pro salīdzinās ar Claude Opus 4.6?
Kas ir thinking_level parametrs Gemini 3.1 Pro?
Kas ir custom tools galapunkts Gemini 3.1 Pro?
Esiet informēti
Saņemiet jaunākās AI ziņas savā e-pastā.
