Code Velocity
Modeli za AI

Gemini 3.1 Pro: Modeli ya Kufikiri-Kwanza ya Google

·6 dakika kusoma·Google, Google DeepMind·Chanzo asili
Shiriki
Ulinganisho wa vipimo vya Gemini 3.1 Pro unaoonyesha alama za ARC-AGI-2 na RE-Bench dhidi ya Gemini 3 Pro na modeli nyingine za mbele

Matokeo ya Vipimo vya Gemini 3.1 Pro

Google DeepMind ilitoa Gemini 3.1 Pro Februari 19, 2026. Modeli hii inazidi mara mbili utendaji wa kufikiri wa mtangulizi wake, ikipata 77.1% kwenye ARC-AGI-2 dhidi ya Gemini 3 Pro.

Gemini 3.1 Pro inalenga kazi zinazohitaji kufikiri kwa hatua nyingi: muundo wa algorithm, usanisi wa data kwa kiwango kikubwa, mtiririko wa kazi wa agentic, na coding changamani.

Gemini 3.1 Pro dhidi ya Claude Opus 4.6 dhidi ya GPT-5.2

KipimoGemini 3.1 ProClaude Opus 4.6GPT-5.2-Codex
ARC-AGI-277.1%
RE-Bench (ML R&D)1.27
Terminal-Bench 2.0#164.0%
Humanity's Last Exam#1
Muktadha (kuingiza)1M200K (1M beta)400K
Muktadha (kutoa)64K128K128K

Kila modeli inaongoza katika maeneo tofauti. Gemini 3.1 Pro inaongoza vipimo vipya vya kufikiri. Claude Opus 4.6 inaongoza agentic coding na kufikiri kwa taaluma nyingi. GPT-5.2-Codex inatoa utendaji wa ushindani wa coding kwa bei nafuu zaidi.

Vipengele Muhimu kwa Watengenezaji

Kina cha Kufikiri Kinachosanidiwa

Gemini 3.1 Pro inaanzisha parameter ya thinking_level inayodhibiti kina cha kufikiri. Kufikiri kwa kiwango cha chini ni haraka na nafuu kwa kazi za kawaida. Kufikiri kwa kiwango cha juu kunatumia hesabu zaidi kwa matatizo changamani.

Hii inafanana na vidhibiti vya juhudi vya Claude Opus 4.6, ingawa Gemini inaweka mpangilio huu kama parameter ya wazi ya API badala ya tabia ya modeli inayobadilika.

Endpoint ya Custom Tools

Endpoint tofauti, gemini-3.1-pro-preview-customtools, imeboreshwa kwa programu za agentic zinazounganisha amri za shell na zana maalum. Inatanguliza uchaguzi sahihi wa zana na utekelezaji, ikipunguza makosa wakati mawakala wanapoingiliana na mifumo ya nje. Hii ni muhimu kwa watengenezaji wanaojenga mawakala sawa na GitHub Agentic Workflows, ambapo usahihi wa uchaguzi wa zana unaathiri moja kwa moja kuaminika kwa otomatiki.

Kuingiza URL ya YouTube

Watengenezaji wanaweza kupitisha URL za YouTube moja kwa moja kwenye maombi. Modeli inachambua maudhui ya video, ikihruhusu mtiririko wa kazi unaochanganya uelewa wa video na uzalishaji wa msimbo au nyaraka.

Uchakataji wa Hali Nyingi

Gemini 3.1 Pro inashughulikia maandishi, picha, sauti, video, na msimbo katika muktadha mmoja. Na dirisha la kuingiza la tokeni 1M, inaweza kuchakata msingi mzima wa msimbo au nyaraka ndefu za utafiti kwa mpigo mmoja.

RE-Bench: Utendaji wa Utafiti wa ML

Kwenye RE-Bench, inayotathmini uwezo wa utafiti na maendeleo ya ML, Gemini 3.1 Pro imepata 1.27 (iliyosawazishwa na binadamu), kutoka 1.04 ya Gemini 3 Pro. Modeli ilikamilisha kazi za uboreshaji katika sekunde 47 dhidi ya rejeleo la sekunde 94 la binadamu.

Upatikanaji wa Gemini 3.1 Pro

Gemini 3.1 Pro inapatikana katika programu ya Gemini, Google Cloud Vertex AI, Google AI Studio, na API ya Gemini. Bei inatofautiana kwa jukwaa. Modeli iko katika hakikisho; upatikanaji wa jumla unatarajiwa kufuata.

Maswali Yanayoulizwa Mara kwa Mara

Gemini 3.1 Pro ni nini?
Gemini 3.1 Pro ni maboresho yaliyoboreshwa kwa kufikiri ya Google DeepMind ya mfululizo wa Gemini 3, yaliyotolewa Februari 19, 2026. Imepata 77.1% kwenye ARC-AGI-2, ikizidi mara mbili utendaji wa kufikiri wa Gemini 3 Pro. Modeli hii inasaidia muktadha wa kuingiza wa tokeni 1M na tokeni 64K za kutoa, na inaanzisha parameter ya thinking_level inayoruhusu watengenezaji kudhibiti kina cha kufikiri cha modeli kabla ya kujibu.
Gemini 3.1 Pro inalinganishwaje na Claude Opus 4.6?
Gemini 3.1 Pro na Claude Opus 4.6 zinalenga nguvu tofauti. Gemini 3.1 Pro inaongoza kwenye ARC-AGI-2 (77.1%) na RE-Bench kwa ML R&D, wakati Claude Opus 4.6 inashikilia nafasi ya juu kwenye Terminal-Bench 2.0 kwa agentic coding na Humanity's Last Exam kwa kufikiri kwa taaluma nyingi. Zote mbili zinatoa madirisha ya muktadha ya tokeni 1M. Uchaguzi unategemea mzigo wa kazi: Gemini inafanya vyema kwenye kazi mpya za kufikiri, Claude kwa kazi endelevu za coding.
Parameter ya thinking_level katika Gemini 3.1 Pro ni nini?
Parameter ya thinking_level inaruhusu watengenezaji kudhibiti kina cha juu zaidi cha kufikiri kinachotumika na modeli kabla ya kutoa jibu. Kufikiri kwa kiwango cha chini ni haraka na nafuu kwa kazi za kawaida. Kufikiri kwa kiwango cha juu kunatumia muda zaidi wa hesabu kwa matatizo changamani ya kufikiri. Hii inawapa watengenezaji udhibiti wa wazi juu ya usawazishaji wa gharama-kasi-ubora, sawa na vidhibiti vya juhudi katika Claude Opus 4.6.
Endpoint ya custom tools katika Gemini 3.1 Pro ni nini?
Gemini 3.1 Pro inajumuisha endpoint tofauti ya API inayoitwa gemini-3.1-pro-preview-customtools, iliyoboreshwa kwa kutanguliza zana maalum za watengenezaji. Wakati wa kujenga programu za agentic zenye mchanganyiko wa amri za bash na zana maalum, endpoint hii inahakikisha modeli inachagua na kuita zana sahihi kwa usahihi. Hii ni muhimu sana kwa watengenezaji wanaojenga mawakala wa AI wanaohitaji kuingiliana na mifumo na API za nje.

Baki na Habari

Pokea habari za hivi karibuni za AI kwenye barua pepe yako.

Shiriki