Code Velocity
MI modeļi

Gemini 3.1 Pro: Google domāšanai orientētais modelis

·6 min lasīšana·Google, Google DeepMind·Sākotnējais avots
Dalīties
Gemini 3.1 Pro etalontesta salīdzinājums, kas parāda ARC-AGI-2 un RE-Bench rezultātus pret Gemini 3 Pro un citiem priekšējās līnijas modeļiem

Gemini 3.1 Pro etalontesta rezultāti

Google DeepMind izlaida Gemini 3.1 Pro 2026. gada 19. februārī. Modelis vairāk nekā divkāršo sava priekšteča domāšanas veiktspēju, sasniedzot 77,1% ARC-AGI-2 salīdzinājumā ar Gemini 3 Pro.

Gemini 3.1 Pro mērķē uz uzdevumiem, kam nepieciešama daudzsoļu domāšana: algoritmu projektēšana, liela mēroga datu sintēze, agenturālās darba plūsmas un sarežģīta kodēšana.

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2

EtalontestsGemini 3.1 ProClaude Opus 4.6GPT-5.2-Codex
ARC-AGI-277,1%
RE-Bench (ML R&D)1,27
Terminal-Bench 2.0#164,0%
Humanity's Last Exam#1
Konteksts (ievade)1M200K (1M beta)400K
Konteksts (izvade)64K128K128K

Katrs modelis vada dažādās jomās. Gemini 3.1 Pro izceļas jaunos domāšanas etalontestos. Claude Opus 4.6 vada agenturālo kodēšanu un multidisciplināro domāšanu. GPT-5.2-Codex piedāvā konkurētspējīgu kodēšanas veiktspēju par zemāku cenu.

Galvenās funkcijas izstrādātājiem

Konfigurējams domāšanas dziļums

Gemini 3.1 Pro ievieš thinking_level parametru domāšanas dziļuma kontrolei. Zems thinking ir ātrs un lēts rutīnas uzdevumiem. Augsts thinking piešķir vairāk skaitļošanas sarežģītām problēmām.

Konceptuāli līdzīgs Claude Opus 4.6 piepūles vadīklām, lai gan Gemini atklāj iestatījumu kā tiešu API parametru, nevis adaptīvu modeļa uzvedību.

Custom tools galapunkts

Atsevišķs galapunkts gemini-3.1-pro-preview-customtools ir optimizēts agenturālām lietojumprogrammām, kas apvieno čaulas komandas ar pielāgotiem rīkiem. Tas prioritizē pareizu rīka izvēli un izsaukšanu, samazinot kļūdas, kad aģenti sadarbojas ar ārējām sistēmām. Tas ir nozīmīgi izstrādātājiem, kas veido aģentus līdzīgi GitHub Agentic Workflows, kur rīka izvēles precizitāte tieši ietekmē automatizācijas uzticamību.

YouTube URL ievade

Izstrādātāji var nodot YouTube URL tieši vaicājumos. Modelis analizē video saturu, ļaujot darba plūsmām apvienot video izpratni ar koda ģenerēšanu vai dokumentāciju.

Multimodāla apstrāde

Gemini 3.1 Pro apstrādā tekstu, attēlus, audio, video un kodu vienā kontekstā. Ar 1M tokenu ievades logu tas var apstrādāt veselas kodu bāzes vai garus pētniecības dokumentus vienā piegājienā.

RE-Bench: ML pētniecības veiktspēja

RE-Bench, kas novērtē ML pētniecības un izstrādes spējas, Gemini 3.1 Pro sasniedz cilvēka normalizētu rezultātu 1,27, palielinoties no Gemini 3 Pro 1,04. Modelis pabeidza optimizācijas uzdevumus 47 sekundēs salīdzinājumā ar cilvēku 94 sekunžu atsauci.

Gemini 3.1 Pro pieejamība

Gemini 3.1 Pro ir pieejams Gemini lietotnē, Google Cloud Vertex AI, Google AI Studio un Gemini API. Cenas atšķiras pa platformām. Modelis ir priekšskatījumā; vispārēja pieejamība sagaidāma drīzumā.

Bieži uzdotie jautājumi

Kas ir Gemini 3.1 Pro?
Gemini 3.1 Pro ir Google DeepMind domāšanai optimizēts Gemini 3 sērijas uzlabojums, izlaists 2026. gada 19. februārī. Tas sasniedz 77,1% ARC-AGI-2, vairāk nekā divkāršojot Gemini 3 Pro domāšanas veiktspēju. Modelis atbalsta 1M tokenu ievades kontekstu un 64K izvades tokenus un ievieš thinking_level parametru, kas ļauj izstrādātājiem kontrolēt, cik dziļi modelis domā pirms atbildēšanas.
Kā Gemini 3.1 Pro salīdzinās ar Claude Opus 4.6?
Gemini 3.1 Pro un Claude Opus 4.6 mērķē uz dažādām stiprajām pusēm. Gemini 3.1 Pro vada ARC-AGI-2 (77,1%) un RE-Bench ML pētniecībai, savukārt Claude Opus 4.6 tur #1 pozīciju Terminal-Bench 2.0 agenturālajai kodēšanai un Humanity's Last Exam multidisciplinārajai domāšanai. Abiem ir 1M tokenu konteksta logi. Izvēle atkarīga no uzdevuma: Gemini izceļas jaunos domāšanas uzdevumos, Claude — ilgstošā kodēšanas darbā.
Kas ir thinking_level parametrs Gemini 3.1 Pro?
Thinking_level parametrs ļauj izstrādātājiem kontrolēt maksimālo domāšanas dziļumu, ko modelis piemēro pirms atbildes sniegšanas. Zems thinking ir ātrāks un lētāks vienkāršiem uzdevumiem. Augsts thinking piešķir vairāk skaitļošanas laika sarežģītām domāšanas problēmām. Tas dod izstrādātājiem tiešu kontroli pār izmaksu-ātruma-kvalitātes kompromisu, līdzīgi Claude Opus 4.6 piepūles vadīklām.
Kas ir custom tools galapunkts Gemini 3.1 Pro?
Gemini 3.1 Pro ietver atsevišķu API galapunktu ar nosaukumu gemini-3.1-pro-preview-customtools, kas optimizēts pielāgotu izstrādātāju rīku prioritizēšanai. Veidojot agenturālas lietojumprogrammas ar bash komandu un pielāgotu rīku kombināciju, šis galapunkts nodrošina modeļa pareizu rīka izvēli un izsaukšanu. Tas ir īpaši noderīgi izstrādātājiem, kas veido MI aģentus, kuriem jāsadarbojas ar ārējām sistēmām un API.

Esiet informēti

Saņemiet jaunākās AI ziņas savā e-pastā.

Dalīties