Matokeo ya Vipimo vya Gemini 3.1 Pro
Google DeepMind ilitoa Gemini 3.1 Pro Februari 19, 2026. Modeli hii inazidi mara mbili utendaji wa kufikiri wa mtangulizi wake, ikipata 77.1% kwenye ARC-AGI-2 dhidi ya Gemini 3 Pro.
Gemini 3.1 Pro inalenga kazi zinazohitaji kufikiri kwa hatua nyingi: muundo wa algorithm, usanisi wa data kwa kiwango kikubwa, mtiririko wa kazi wa agentic, na coding changamani.
Gemini 3.1 Pro dhidi ya Claude Opus 4.6 dhidi ya GPT-5.2
| Kipimo | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77.1% | — | — |
| RE-Bench (ML R&D) | 1.27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64.0% |
| Humanity's Last Exam | — | #1 | — |
| Muktadha (kuingiza) | 1M | 200K (1M beta) | 400K |
| Muktadha (kutoa) | 64K | 128K | 128K |
Kila modeli inaongoza katika maeneo tofauti. Gemini 3.1 Pro inaongoza vipimo vipya vya kufikiri. Claude Opus 4.6 inaongoza agentic coding na kufikiri kwa taaluma nyingi. GPT-5.2-Codex inatoa utendaji wa ushindani wa coding kwa bei nafuu zaidi.
Vipengele Muhimu kwa Watengenezaji
Kina cha Kufikiri Kinachosanidiwa
Gemini 3.1 Pro inaanzisha parameter ya thinking_level inayodhibiti kina cha kufikiri. Kufikiri kwa kiwango cha chini ni haraka na nafuu kwa kazi za kawaida. Kufikiri kwa kiwango cha juu kunatumia hesabu zaidi kwa matatizo changamani.
Hii inafanana na vidhibiti vya juhudi vya Claude Opus 4.6, ingawa Gemini inaweka mpangilio huu kama parameter ya wazi ya API badala ya tabia ya modeli inayobadilika.
Endpoint ya Custom Tools
Endpoint tofauti, gemini-3.1-pro-preview-customtools, imeboreshwa kwa programu za agentic zinazounganisha amri za shell na zana maalum. Inatanguliza uchaguzi sahihi wa zana na utekelezaji, ikipunguza makosa wakati mawakala wanapoingiliana na mifumo ya nje. Hii ni muhimu kwa watengenezaji wanaojenga mawakala sawa na GitHub Agentic Workflows, ambapo usahihi wa uchaguzi wa zana unaathiri moja kwa moja kuaminika kwa otomatiki.
Kuingiza URL ya YouTube
Watengenezaji wanaweza kupitisha URL za YouTube moja kwa moja kwenye maombi. Modeli inachambua maudhui ya video, ikihruhusu mtiririko wa kazi unaochanganya uelewa wa video na uzalishaji wa msimbo au nyaraka.
Uchakataji wa Hali Nyingi
Gemini 3.1 Pro inashughulikia maandishi, picha, sauti, video, na msimbo katika muktadha mmoja. Na dirisha la kuingiza la tokeni 1M, inaweza kuchakata msingi mzima wa msimbo au nyaraka ndefu za utafiti kwa mpigo mmoja.
RE-Bench: Utendaji wa Utafiti wa ML
Kwenye RE-Bench, inayotathmini uwezo wa utafiti na maendeleo ya ML, Gemini 3.1 Pro imepata 1.27 (iliyosawazishwa na binadamu), kutoka 1.04 ya Gemini 3 Pro. Modeli ilikamilisha kazi za uboreshaji katika sekunde 47 dhidi ya rejeleo la sekunde 94 la binadamu.
Upatikanaji wa Gemini 3.1 Pro
Gemini 3.1 Pro inapatikana katika programu ya Gemini, Google Cloud Vertex AI, Google AI Studio, na API ya Gemini. Bei inatofautiana kwa jukwaa. Modeli iko katika hakikisho; upatikanaji wa jumla unatarajiwa kufuata.
Maswali Yanayoulizwa Mara kwa Mara
Gemini 3.1 Pro ni nini?
Gemini 3.1 Pro inalinganishwaje na Claude Opus 4.6?
Parameter ya thinking_level katika Gemini 3.1 Pro ni nini?
Endpoint ya custom tools katika Gemini 3.1 Pro ni nini?
Baki na Habari
Pokea habari za hivi karibuni za AI kwenye barua pepe yako.
