Gemini 3.1 Pro Benchmark Sonuçları
Google DeepMind, 19 Şubat 2026'da Gemini 3.1 Pro'yu yayınladı. Model, selefinin akıl yürütme performansını ikiye katlayarak ARC-AGI-2'de Gemini 3 Pro'ya karşı %77,1 puan almıştır.
Gemini 3.1 Pro, çok adımlı akıl yürütme gerektiren görevleri hedefler: algoritma tasarımı, büyük ölçekli veri sentezi, ajantik iş akışları ve karmaşık kodlama.
Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2
| Benchmark | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | %77,1 | — | — |
| RE-Bench (ML Ar-Ge) | 1,27 | — | — |
| Terminal-Bench 2.0 | — | #1 | %64,0 |
| Humanity's Last Exam | — | #1 | — |
| Bağlam (giriş) | 1M | 200K (1M beta) | 400K |
| Bağlam (çıkış) | 64K | 128K | 128K |
Her model farklı alanlarda liderdir. Gemini 3.1 Pro yeni akıl yürütme benchmark'larında öne çıkar. Claude Opus 4.6 ajantik kodlama ve çok disiplinli akıl yürütmede liderdir. GPT-5.2-Codex daha düşük fiyatlandırmayla rekabetçi kodlama performansı sunar.
Geliştiriciler İçin Temel Özellikler
Yapılandırılabilir Düşünme Derinliği
Gemini 3.1 Pro, akıl yürütme derinliğini kontrol eden thinking_level parametresini tanıtır. Düşük düşünme, rutin görevler için hızlı ve ucuzdur. Yüksek düşünme, karmaşık sorunlara daha fazla hesaplama uygular.
Bu, Claude Opus 4.6'nın çaba kontrollerine benzer; ancak Gemini ayarı uyarlanabilir model davranışı yerine açık bir API parametresi olarak sunar.
Özel Araçlar Uç Noktası
Ayrı bir uç nokta olan gemini-3.1-pro-preview-customtools, kabuk komutlarını özel araçlarla birleştiren ajantik uygulamalar için optimize edilmiştir. Doğru araç seçimi ve çağrısını önceliklendirerek ajanlar harici sistemlerle etkileşim kurduğunda hataları azaltır. Bu, araç seçimi doğruluğunun otomasyon güvenilirliğini doğrudan etkilediği GitHub Agentic Workflows benzeri ajanlar oluşturan geliştiriciler için önemlidir.
YouTube URL Girişi
Geliştiriciler, YouTube URL'lerini doğrudan istemlere aktarabilir. Model video içeriğini analiz eder ve video anlayışını kod üretimi veya belgeleme ile birleştiren iş akışlarını mümkün kılar.
Çok Modlu İşleme
Gemini 3.1 Pro, tek bir bağlamda metin, görüntü, ses, video ve kodu işler. 1M token giriş penceresiyle, tüm kod tabanlarını veya uzun araştırma belgelerini tek seferde işleyebilir.
RE-Bench: Makine Öğrenimi Araştırma Performansı
Makine öğrenimi araştırma ve geliştirme yeteneklerini değerlendiren RE-Bench'te Gemini 3.1 Pro, Gemini 3 Pro'nun 1,04'üne karşı 1,27 (insan normalleştirilmiş) puan alır. Model, optimizasyon görevlerini 94 saniyelik insan referansına karşı 47 saniyede tamamladı.
Gemini 3.1 Pro Kullanılabilirlik
Gemini 3.1 Pro; Gemini uygulaması, Google Cloud Vertex AI, Google AI Studio ve Gemini API'de mevcuttur. Fiyatlandırma platforma göre değişir. Model önizleme aşamasındadır; genel kullanılabilirliğin takip etmesi beklenmektedir.
Sık Sorulan Sorular
Gemini 3.1 Pro nedir?
Gemini 3.1 Pro ile Claude Opus 4.6 nasıl karşılaştırılır?
Gemini 3.1 Pro'daki thinking_level parametresi nedir?
Gemini 3.1 Pro'daki özel araçlar uç noktası nedir?
Güncel Kalın
En son yapay zeka haberlerini e-postanıza alın.
