Результати Бенчмарків Gemini 3.1 Pro
Google DeepMind випустив Gemini 3.1 Pro 19 лютого 2026 року. Модель більш ніж удвічі перевершує продуктивність міркування попередника, набираючи 77.1% на ARC-AGI-2 порівняно з Gemini 3 Pro.
Gemini 3.1 Pro орієнтований на завдання, що вимагають багатокрокового міркування: проєктування алгоритмів, синтез даних великого масштабу, агентні робочі процеси та складне кодування.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| Бенчмарк | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77.1% | — | — |
| RE-Bench (ML R&D) | 1.27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64.0% |
| Humanity's Last Exam | — | #1 | — |
| Контекст (вхід) | 1M | 200K (1M бета) | 400K |
| Контекст (вихід) | 64K | 128K | 128K |
Кожна модель лідирує в різних сферах. Gemini 3.1 Pro очолює бенчмарки нового міркування. Claude Opus 4.6 лідирує в агентному кодуванні та мультидисциплінарному міркуванні. GPT-5.2-Codex пропонує конкурентну продуктивність кодування за нижчою ціною.
Ключові Функції Для Розробників
Налаштовувана Глибина Міркування
Gemini 3.1 Pro вводить параметр thinking_level, що контролює глибину міркування. Низький рівень thinking швидкий і дешевий для рутинних завдань. Високий рівень thinking застосовує більше обчислень до складних проблем.
Це подібне до контролю зусиль Claude Opus 4.6, хоча Gemini представляє налаштування як явний параметр API, а не адаптивну поведінку моделі.
Endpoint Custom Tools
Окремий endpoint, gemini-3.1-pro-preview-customtools, оптимізований для агентних додатків, що поєднують команди оболонки з користувацькими інструментами. Він пріоритезує правильний вибір та виклик інструментів, зменшуючи помилки при взаємодії агентів із зовнішніми системами. Це стосується розробників, що створюють агентів, подібних до GitHub Agentic Workflows, де точність вибору інструментів безпосередньо впливає на надійність автоматизації.
Введення URL YouTube
Розробники можуть передавати URL YouTube безпосередньо в промпти. Модель аналізує відеоконтент, дозволяючи робочі процеси, що поєднують розуміння відео з генерацією коду або документації.
Мультимодальна Обробка
Gemini 3.1 Pro обробляє текст, зображення, аудіо, відео та код в одному контексті. З вхідним вікном на 1M токенів він може обробити цілі кодові бази або довгі дослідницькі документи за один раз.
RE-Bench: Продуктивність у Дослідженнях ML
На RE-Bench, що оцінює здатності до досліджень та розробки ML, Gemini 3.1 Pro набирає 1.27 (нормалізований за людиною), зростання з 1.04 у Gemini 3 Pro. Модель виконала завдання оптимізації за 47 секунд проти 94-секундного людського еталона.
Доступність Gemini 3.1 Pro
Gemini 3.1 Pro доступний у додатку Gemini, Google Cloud Vertex AI, Google AI Studio та Gemini API. Ціни варіюються залежно від платформи. Модель у попередньому перегляді; загальна доступність очікується пізніше.
Поширені запитання
Що таке Gemini 3.1 Pro?
Як Gemini 3.1 Pro порівнюється з Claude Opus 4.6?
Що таке параметр thinking_level у Gemini 3.1 Pro?
Що таке endpoint custom tools у Gemini 3.1 Pro?
Будьте в курсі
Отримуйте найсвіжіші новини ШІ на пошту.
