Gemini 3.1 Pro: Моделот на Google со Фокус на Расудување

Резултати од Бенчмаркови на Gemini 3.1 Pro

Google DeepMind го објави Gemini 3.1 Pro на 19 февруари 2026. Моделот повеќе од удвојува перформансата на расудување на претходникот, постигнувајќи 77.1% на ARC-AGI-2 наспроти Gemini 3 Pro.

Gemini 3.1 Pro цели задачи кои бараат повеќестепено расудување: дизајн на алгоритми, синтеза на податоци во голем обем, агентски работни процеси и сложено кодирање.

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2

Бенчмарк	Gemini 3.1 Pro	Claude Opus 4.6	GPT-5.2-Codex
ARC-AGI-2	77.1%	—	—
RE-Bench (ML R&D)	1.27	—	—
Terminal-Bench 2.0	—	#1	64.0%
Humanity's Last Exam	—	#1	—
Контекст (влез)	1M	200K (1M бета)	400K
Контекст (излез)	64K	128K	128K

Секој модел води во различни области. Gemini 3.1 Pro ги предводи бенчмарковите за ново расудување. Claude Opus 4.6 води во агентско кодирање и мултидисциплинарно расудување. GPT-5.2-Codex нуди конкурентна перформанса во кодирање по пониска цена.

Клучни Функции за Програмери

Конфигурабилна Длабочина на Расудување

Gemini 3.1 Pro воведува параметар thinking_level кој ја контролира длабочината на расудување. Ниско thinking е брзо и евтино за рутински задачи. Високо thinking применува повеќе пресметки за сложени проблеми.

Ова е слично на контролите за напор на Claude Opus 4.6, иако Gemini го прикажува поставувањето како експлицитен API параметар наместо адаптивно однесување на моделот.

Endpoint за Custom Tools

Посебен endpoint, gemini-3.1-pro-preview-customtools, е оптимизиран за агентски апликации кои комбинираат shell команди со кориснички алатки. Тој го приоритизира правилниот избор и повикување на алатки, намалувајќи грешки кога агентите интерактираат со надворешни системи. Ова е релевантно за програмери кои градат агенти слични на GitHub Agentic Workflows, каде точноста на изборот на алатки директно влијае врз доверливоста на автоматизацијата.

Внесување YouTube URL

Програмерите можат да пренесат YouTube URL директно во промптови. Моделот ја анализира видео содржината, овозможувајќи работни процеси кои го комбинираат разбирањето на видео со генерирање код или документација.

Мултимодална Обработка

Gemini 3.1 Pro обработува текст, слики, аудио, видео и код во единствен контекст. Со влезен прозорец од 1M токени, може да обработи цели кодови бази или долги истражувачки документи одеднаш.

RE-Bench: Перформанса во ML Истражување

На RE-Bench, кој ги оценува способностите за ML истражување и развој, Gemini 3.1 Pro постигнува 1.27 (нормализирано спрема човек), зголемување од 1.04 кај Gemini 3 Pro. Моделот ги заврши задачите за оптимизација за 47 секунди наспроти 94-секундната човечка референца.

Достапност на Gemini 3.1 Pro

Gemini 3.1 Pro е достапен во апликацијата Gemini, Google Cloud Vertex AI, Google AI Studio и Gemini API. Цените варираат по платформа. Моделот е во преглед; општа достапност се очекува да следи.

Често поставувани прашања

Што е Gemini 3.1 Pro?

Gemini 3.1 Pro е оптимизираната за расудување надградба на серијата Gemini 3 од Google DeepMind, објавена на 19 февруари 2026. Постигнува 77.1% на ARC-AGI-2, повеќе од удвојувајќи ја перформансата на расудување на Gemini 3 Pro. Моделот поддржува влезен контекст од 1M токени и 64K излезни токени и воведува параметар thinking_level кој им овозможува на програмерите да ја контролираат длабочината на расудување на моделот пред да одговори.

Како се споредува Gemini 3.1 Pro со Claude Opus 4.6?

Gemini 3.1 Pro и Claude Opus 4.6 целат различни јаки страни. Gemini 3.1 Pro води на ARC-AGI-2 (77.1%) и RE-Bench за ML R&D, додека Claude Opus 4.6 ја држи водечката позиција на Terminal-Bench 2.0 за агентско кодирање и Humanity's Last Exam за мултидисциплинарно расудување. Двата нудат контекстни прозорци од 1M токени. Изборот зависи од оптоварувањето: Gemini е одличен во нови задачи за расудување, Claude во долготрајна работа со код.

Што е параметарот thinking_level во Gemini 3.1 Pro?

Параметарот thinking_level им овозможува на програмерите да ја контролираат максималната длабочина на расудување што моделот ја применува пред да произведе одговор. Ниско thinking е побрзо и поевтино за едноставни задачи. Високо thinking доделува повеќе пресметковно време за сложени проблеми на расудување. Ова им дава на програмерите експлицитна контрола врз компромисот цена-брзина-квалитет, слично на контролите за напор во Claude Opus 4.6.

Што е endpoint за custom tools во Gemini 3.1 Pro?

Gemini 3.1 Pro вклучува посебен API endpoint наречен gemini-3.1-pro-preview-customtools, оптимизиран за приоритизирање на кориснички алатки на програмери. При градење агентски апликации со мешавина од bash команди и кориснички алатки, овој endpoint обезбедува моделот правилно да ја избере и повика вистинската алатка. Ова е особено корисно за програмери кои градат AI агенти што треба да интерактираат со надворешни системи и API.