Code Velocity
АИ модели

Gemini 3.1 Pro: Google-ов модел са фокусом на закључивање

·6 min čitanja·Google, Google DeepMind·Originalni izvor
Podeli
Поређење перформанси Gemini 3.1 Pro које приказује резултате ARC-AGI-2 и RE-Bench у односу на Gemini 3 Pro и друге моделе

Резултати перформанси Gemini 3.1 Pro

Google DeepMind је објавио Gemini 3.1 Pro 19. фебруара 2026. Модел више него удвостручава перформансе закључивања свог претходника — постиже 77,1% на ARC-AGI-2 у поређењу са Gemini 3 Pro.

Gemini 3.1 Pro циља задатке који захтевају вишекорачно закључивање: дизајн алгоритама, синтезу података великог обима, агентне токове рада и сложено кодирање.

Gemini 3.1 Pro против Claude Opus 4.6 против GPT-5.2

ТестGemini 3.1 ProClaude Opus 4.6GPT-5.2-Codex
ARC-AGI-277,1%
RE-Bench (ML R&D)1,27
Terminal-Bench 2.0#164,0%
Humanity's Last Exam#1
Контекст (улаз)1M200K (1M бета)400K
Контекст (излаз)64K128K128K

Сваки модел води у различитим областима. Gemini 3.1 Pro је на врху тестова новог закључивања. Claude Opus 4.6 води у агентном кодирању и мултидисциплинарном закључивању. GPT-5.2-Codex нуди конкурентне перформансе кодирања по нижој цени.

Кључне функције за програмере

Подесива дубина размишљања

Gemini 3.1 Pro уводи параметар thinking_level за контролу дубине закључивања. Низак ниво размишљања је брз и јефтин за рутинске задатке. Висок ниво размишљања додељује више рачунарске снаге сложеним проблемима.

Ово је слично контролама напора Claude Opus 4.6, иако Gemini излаже подешавање као експлицитни АПИ параметар уместо адаптивног понашања модела.

Крајња тачка за прилагођене алате

Засебна крајња тачка, gemini-3.1-pro-preview-customtools, оптимизована је за агентне апликације које комбинују shell команде са прилагођеним алатима. Приоритизује исправан одабир и позивање алата, смањујући грешке када агенти комуницирају са спољним системима. Ово је релевантно за програмере који граде агенте сличне GitHub Agentic Workflows, где прецизност одабира алата директно утиче на поузданост аутоматизације.

YouTube URL улаз

Програмери могу проследити YouTube URL-ове директно у промпт. Модел анализира видео садржај, омогућавајући токове рада који комбинују разумевање видеа са генерисањем кода или документације.

Мултимодална обрада

Gemini 3.1 Pro обрађује текст, слике, аудио, видео и код у једном контексту. Са улазним прозором од 1M токена, може обрадити целе кодне базе или дугачке истраживачке документе у једном пролазу.

RE-Bench: перформансе у ML истраживању

На RE-Bench тесту, који евалуира способности ML истраживања и развоја, Gemini 3.1 Pro постиже 1,27 (нормализовано на човека), напредак од 1,04 код Gemini 3 Pro. Модел је задатке оптимизације завршио за 47 секунди наспрам 94-секундне људске референтне вредности.

Доступност Gemini 3.1 Pro

Gemini 3.1 Pro је доступан у Gemini апликацији, Google Cloud Vertex AI, Google AI Studio и преко Gemini АПИ-ја. Цене варирају по платформи. Модел је у прегледу; општа доступност се очекује ускоро.

Često postavljana pitanja

Шта је Gemini 3.1 Pro?
Gemini 3.1 Pro је надоградња серије Gemini 3 од Google DeepMind оптимизована за закључивање, објављена 19. фебруара 2026. Постиже 77,1% на ARC-AGI-2, више него удвостручавајући перформансе закључивања Gemini 3 Pro. Модел подржава улазни контекст од 1M токена и 64K излазних токена, и уводи параметар thinking_level који програмерима омогућава контролу дубине закључивања модела пре одговора.
Како се Gemini 3.1 Pro пореди са Claude Opus 4.6?
Gemini 3.1 Pro и Claude Opus 4.6 циљају различите снаге. Gemini 3.1 Pro води на ARC-AGI-2 (77,1%) и RE-Bench за ML истраживање и развој, док Claude Opus 4.6 држи врх на Terminal-Bench 2.0 за агентно кодирање и Humanity's Last Exam за мултидисциплинарно закључивање. Оба нуде контекстне прозоре од 1M токена. Избор зависи од радног оптерећења: Gemini се истиче у новим задацима закључивања, Claude у трајном раду кодирања.
Шта је параметар thinking_level у Gemini 3.1 Pro?
Параметар thinking_level програмерима омогућава контролу максималне дубине закључивања коју модел примењује пре генерисања одговора. Низак ниво размишљања је бржи и јефтинији за једноставне задатке. Висок ниво размишљања додељује више рачунарског времена за сложене проблеме закључивања. Ово програмерима даје експлицитну контролу над односом цене, брзине и квалитета, слично контролама напора у Claude Opus 4.6.
Шта је крајња тачка за прилагођене алате у Gemini 3.1 Pro?
Gemini 3.1 Pro укључује засебну АПИ крајњу тачку под називом gemini-3.1-pro-preview-customtools, оптимизовану за приоритизацију прилагођених алата програмера. При изградњи агентних апликација са комбинацијом bash команди и прилагођених алата, ова крајња тачка обезбеђује да модел исправно одабере и позове прави алат. Ово је посебно корисно за програмере који граде АИ агенте за интеракцију са спољним системима и АПИ-јима.

Будите у току

Примајте најновије AI вести на имејл.

Podeli