Резултати од Бенчмаркови на Gemini 3.1 Pro
Google DeepMind го објави Gemini 3.1 Pro на 19 февруари 2026. Моделот повеќе од удвојува перформансата на расудување на претходникот, постигнувајќи 77.1% на ARC-AGI-2 наспроти Gemini 3 Pro.
Gemini 3.1 Pro цели задачи кои бараат повеќестепено расудување: дизајн на алгоритми, синтеза на податоци во голем обем, агентски работни процеси и сложено кодирање.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| Бенчмарк | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77.1% | — | — |
| RE-Bench (ML R&D) | 1.27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64.0% |
| Humanity's Last Exam | — | #1 | — |
| Контекст (влез) | 1M | 200K (1M бета) | 400K |
| Контекст (излез) | 64K | 128K | 128K |
Секој модел води во различни области. Gemini 3.1 Pro ги предводи бенчмарковите за ново расудување. Claude Opus 4.6 води во агентско кодирање и мултидисциплинарно расудување. GPT-5.2-Codex нуди конкурентна перформанса во кодирање по пониска цена.
Клучни Функции за Програмери
Конфигурабилна Длабочина на Расудување
Gemini 3.1 Pro воведува параметар thinking_level кој ја контролира длабочината на расудување. Ниско thinking е брзо и евтино за рутински задачи. Високо thinking применува повеќе пресметки за сложени проблеми.
Ова е слично на контролите за напор на Claude Opus 4.6, иако Gemini го прикажува поставувањето како експлицитен API параметар наместо адаптивно однесување на моделот.
Endpoint за Custom Tools
Посебен endpoint, gemini-3.1-pro-preview-customtools, е оптимизиран за агентски апликации кои комбинираат shell команди со кориснички алатки. Тој го приоритизира правилниот избор и повикување на алатки, намалувајќи грешки кога агентите интерактираат со надворешни системи. Ова е релевантно за програмери кои градат агенти слични на GitHub Agentic Workflows, каде точноста на изборот на алатки директно влијае врз доверливоста на автоматизацијата.
Внесување YouTube URL
Програмерите можат да пренесат YouTube URL директно во промптови. Моделот ја анализира видео содржината, овозможувајќи работни процеси кои го комбинираат разбирањето на видео со генерирање код или документација.
Мултимодална Обработка
Gemini 3.1 Pro обработува текст, слики, аудио, видео и код во единствен контекст. Со влезен прозорец од 1M токени, може да обработи цели кодови бази или долги истражувачки документи одеднаш.
RE-Bench: Перформанса во ML Истражување
На RE-Bench, кој ги оценува способностите за ML истражување и развој, Gemini 3.1 Pro постигнува 1.27 (нормализирано спрема човек), зголемување од 1.04 кај Gemini 3 Pro. Моделот ги заврши задачите за оптимизација за 47 секунди наспроти 94-секундната човечка референца.
Достапност на Gemini 3.1 Pro
Gemini 3.1 Pro е достапен во апликацијата Gemini, Google Cloud Vertex AI, Google AI Studio и Gemini API. Цените варираат по платформа. Моделот е во преглед; општа достапност се очекува да следи.
Оригинален извор
https://blog.google/technology/google-deepmind/gemini-3-1-pro/Често поставувани прашања
Што е Gemini 3.1 Pro?
Како се споредува Gemini 3.1 Pro со Claude Opus 4.6?
Што е параметарот thinking_level во Gemini 3.1 Pro?
Што е endpoint за custom tools во Gemini 3.1 Pro?
Бидете информирани
Добивајте ги најновите AI вести на е-пошта.
