Резултати перформанси Gemini 3.1 Pro
Google DeepMind је објавио Gemini 3.1 Pro 19. фебруара 2026. Модел више него удвостручава перформансе закључивања свог претходника — постиже 77,1% на ARC-AGI-2 у поређењу са Gemini 3 Pro.
Gemini 3.1 Pro циља задатке који захтевају вишекорачно закључивање: дизајн алгоритама, синтезу података великог обима, агентне токове рада и сложено кодирање.
Gemini 3.1 Pro против Claude Opus 4.6 против GPT-5.2
| Тест | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77,1% | — | — |
| RE-Bench (ML R&D) | 1,27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64,0% |
| Humanity's Last Exam | — | #1 | — |
| Контекст (улаз) | 1M | 200K (1M бета) | 400K |
| Контекст (излаз) | 64K | 128K | 128K |
Сваки модел води у различитим областима. Gemini 3.1 Pro је на врху тестова новог закључивања. Claude Opus 4.6 води у агентном кодирању и мултидисциплинарном закључивању. GPT-5.2-Codex нуди конкурентне перформансе кодирања по нижој цени.
Кључне функције за програмере
Подесива дубина размишљања
Gemini 3.1 Pro уводи параметар thinking_level за контролу дубине закључивања. Низак ниво размишљања је брз и јефтин за рутинске задатке. Висок ниво размишљања додељује више рачунарске снаге сложеним проблемима.
Ово је слично контролама напора Claude Opus 4.6, иако Gemini излаже подешавање као експлицитни АПИ параметар уместо адаптивног понашања модела.
Крајња тачка за прилагођене алате
Засебна крајња тачка, gemini-3.1-pro-preview-customtools, оптимизована је за агентне апликације које комбинују shell команде са прилагођеним алатима. Приоритизује исправан одабир и позивање алата, смањујући грешке када агенти комуницирају са спољним системима. Ово је релевантно за програмере који граде агенте сличне GitHub Agentic Workflows, где прецизност одабира алата директно утиче на поузданост аутоматизације.
YouTube URL улаз
Програмери могу проследити YouTube URL-ове директно у промпт. Модел анализира видео садржај, омогућавајући токове рада који комбинују разумевање видеа са генерисањем кода или документације.
Мултимодална обрада
Gemini 3.1 Pro обрађује текст, слике, аудио, видео и код у једном контексту. Са улазним прозором од 1M токена, може обрадити целе кодне базе или дугачке истраживачке документе у једном пролазу.
RE-Bench: перформансе у ML истраживању
На RE-Bench тесту, који евалуира способности ML истраживања и развоја, Gemini 3.1 Pro постиже 1,27 (нормализовано на човека), напредак од 1,04 код Gemini 3 Pro. Модел је задатке оптимизације завршио за 47 секунди наспрам 94-секундне људске референтне вредности.
Доступност Gemini 3.1 Pro
Gemini 3.1 Pro је доступан у Gemini апликацији, Google Cloud Vertex AI, Google AI Studio и преко Gemini АПИ-ја. Цене варирају по платформи. Модел је у прегледу; општа доступност се очекује ускоро.
Originalni izvor
https://blog.google/technology/google-deepmind/gemini-3-1-pro/Često postavljana pitanja
Шта је Gemini 3.1 Pro?
Како се Gemini 3.1 Pro пореди са Claude Opus 4.6?
Шта је параметар thinking_level у Gemini 3.1 Pro?
Шта је крајња тачка за прилагођене алате у Gemini 3.1 Pro?
Будите у току
Примајте најновије AI вести на имејл.
