Resultados de Benchmark do Gemini 3.1 Pro
O Google DeepMind lançou o Gemini 3.1 Pro em 19 de fevereiro de 2026. O modelo mais que dobra a performance de raciocínio do seu predecessor, marcando 77.1% no ARC-AGI-2 comparado ao resultado do Gemini 3 Pro.
O Gemini 3.1 Pro é projetado para tarefas onde uma resposta direta não é suficiente: design de algoritmos, síntese de dados em larga escala, workflows agênticos e código complexo.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| Benchmark | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77.1% | — | — |
| RE-Bench (R&D ML) | 1.27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64.0% |
| Humanity's Last Exam | — | #1 | — |
| Contexto (entrada) | 1M | 200K (1M beta) | 400K |
| Contexto (saída) | 64K | 128K | 128K |
Cada modelo lidera em áreas diferentes. Gemini 3.1 Pro se destaca em benchmarks de raciocínio novo. Claude Opus 4.6 lidera em código agêntico e raciocínio multidisciplinar. GPT-5.2-Codex oferece performance competitiva em código com preço mais baixo.
Funcionalidades Principais para Desenvolvedores
Profundidade de Raciocínio Configurável
O Gemini 3.1 Pro introduz um parâmetro thinking_level que controla quão profundamente o modelo raciocina antes de responder. Thinking baixo é rápido e barato para tarefas rotineiras. Thinking alto aplica mais computação para problemas complexos.
É conceitualmente similar ao pensamento adaptativo e controles de esforço no Claude Opus 4.6, embora a implementação do Gemini exponha o controle como um parâmetro explícito da API em vez de um comportamento adaptativo do modelo.
Endpoint de Tools Customizadas
Um endpoint separado, gemini-3.1-pro-preview-customtools, é otimizado para aplicações agênticas que combinam comandos bash com tools customizadas. O endpoint prioriza a seleção e invocação correta de ferramentas, reduzindo erros quando agentes interagem com sistemas externos.
Entrada de URL do YouTube
Desenvolvedores agora podem passar URLs do YouTube diretamente nos prompts. O modelo analisa o conteúdo de vídeo automaticamente, habilitando workflows que combinam compreensão de vídeo com geração de código ou tarefas de documentação.
Processamento Multimodal
O Gemini 3.1 Pro lida com texto, imagens, áudio, vídeo e código em um único contexto. Com janela de entrada de 1M tokens, pode processar codebases inteiras, documentos longos de pesquisa ou workflows profundamente aninhados em uma única passagem.
RE-Bench: Performance em Pesquisa de ML
No RE-Bench, que avalia capacidades de pesquisa e desenvolvimento em ML, Gemini 3.1 Pro alcança um score normalizado por humano de 1.27, acima dos 1.04 do Gemini 3 Pro. O modelo completou tarefas de otimização em 47 segundos comparado à referência humana de 94 segundos.
Disponibilidade do Gemini 3.1 Pro
O Gemini 3.1 Pro está disponível no app Gemini, Google Cloud Vertex AI, Google AI Studio e na API Gemini. Preços específicos variam por plataforma. O modelo está em preview com disponibilidade geral esperada em breve.
Perguntas Frequentes
O que é o Gemini 3.1 Pro?
Como o Gemini 3.1 Pro se compara ao Claude Opus 4.6?
O que é o parâmetro thinking_level no Gemini 3.1 Pro?
O que é o endpoint de tools customizadas no Gemini 3.1 Pro?
Fique Atualizado
Receba as últimas novidades de IA no seu e-mail.
