Code Velocity
Yapay Zeka Modelleri

Gemini 3.1 Pro: Google'ın Akıl Yürütme Odaklı Modeli

·6 dk okuma·Google, Google DeepMind·Orijinal kaynak
Paylaş
Gemini 3.1 Pro benchmark karşılaştırması: ARC-AGI-2 ve RE-Bench puanlarının Gemini 3 Pro ve diğer sınır modelleriyle karşılaştırması

Gemini 3.1 Pro Benchmark Sonuçları

Google DeepMind, 19 Şubat 2026'da Gemini 3.1 Pro'yu yayınladı. Model, selefinin akıl yürütme performansını ikiye katlayarak ARC-AGI-2'de Gemini 3 Pro'ya karşı %77,1 puan almıştır.

Gemini 3.1 Pro, çok adımlı akıl yürütme gerektiren görevleri hedefler: algoritma tasarımı, büyük ölçekli veri sentezi, ajantik iş akışları ve karmaşık kodlama.

Gemini 3.1 Pro vs Claude Opus 4.6 vs GPT-5.2

BenchmarkGemini 3.1 ProClaude Opus 4.6GPT-5.2-Codex
ARC-AGI-2%77,1
RE-Bench (ML Ar-Ge)1,27
Terminal-Bench 2.0#1%64,0
Humanity's Last Exam#1
Bağlam (giriş)1M200K (1M beta)400K
Bağlam (çıkış)64K128K128K

Her model farklı alanlarda liderdir. Gemini 3.1 Pro yeni akıl yürütme benchmark'larında öne çıkar. Claude Opus 4.6 ajantik kodlama ve çok disiplinli akıl yürütmede liderdir. GPT-5.2-Codex daha düşük fiyatlandırmayla rekabetçi kodlama performansı sunar.

Geliştiriciler İçin Temel Özellikler

Yapılandırılabilir Düşünme Derinliği

Gemini 3.1 Pro, akıl yürütme derinliğini kontrol eden thinking_level parametresini tanıtır. Düşük düşünme, rutin görevler için hızlı ve ucuzdur. Yüksek düşünme, karmaşık sorunlara daha fazla hesaplama uygular.

Bu, Claude Opus 4.6'nın çaba kontrollerine benzer; ancak Gemini ayarı uyarlanabilir model davranışı yerine açık bir API parametresi olarak sunar.

Özel Araçlar Uç Noktası

Ayrı bir uç nokta olan gemini-3.1-pro-preview-customtools, kabuk komutlarını özel araçlarla birleştiren ajantik uygulamalar için optimize edilmiştir. Doğru araç seçimi ve çağrısını önceliklendirerek ajanlar harici sistemlerle etkileşim kurduğunda hataları azaltır. Bu, araç seçimi doğruluğunun otomasyon güvenilirliğini doğrudan etkilediği GitHub Agentic Workflows benzeri ajanlar oluşturan geliştiriciler için önemlidir.

YouTube URL Girişi

Geliştiriciler, YouTube URL'lerini doğrudan istemlere aktarabilir. Model video içeriğini analiz eder ve video anlayışını kod üretimi veya belgeleme ile birleştiren iş akışlarını mümkün kılar.

Çok Modlu İşleme

Gemini 3.1 Pro, tek bir bağlamda metin, görüntü, ses, video ve kodu işler. 1M token giriş penceresiyle, tüm kod tabanlarını veya uzun araştırma belgelerini tek seferde işleyebilir.

RE-Bench: Makine Öğrenimi Araştırma Performansı

Makine öğrenimi araştırma ve geliştirme yeteneklerini değerlendiren RE-Bench'te Gemini 3.1 Pro, Gemini 3 Pro'nun 1,04'üne karşı 1,27 (insan normalleştirilmiş) puan alır. Model, optimizasyon görevlerini 94 saniyelik insan referansına karşı 47 saniyede tamamladı.

Gemini 3.1 Pro Kullanılabilirlik

Gemini 3.1 Pro; Gemini uygulaması, Google Cloud Vertex AI, Google AI Studio ve Gemini API'de mevcuttur. Fiyatlandırma platforma göre değişir. Model önizleme aşamasındadır; genel kullanılabilirliğin takip etmesi beklenmektedir.

Sık Sorulan Sorular

Gemini 3.1 Pro nedir?
Gemini 3.1 Pro, Google DeepMind'ın 19 Şubat 2026'da yayınlanan Gemini 3 serisinin akıl yürütme için optimize edilmiş yükseltmesidir. ARC-AGI-2'de %77,1 puan alarak Gemini 3 Pro'nun akıl yürütme performansını ikiye katlamıştır. Model, 1M token giriş bağlamı ve 64K çıkış token desteği sunar ve geliştiricilerin modelin yanıt vermeden önce ne kadar derinlemesine akıl yürüteceğini kontrol etmesine olanak tanıyan thinking_level parametresini tanıtır.
Gemini 3.1 Pro ile Claude Opus 4.6 nasıl karşılaştırılır?
Gemini 3.1 Pro ve Claude Opus 4.6 farklı güçlü yönleri hedefler. Gemini 3.1 Pro, ARC-AGI-2'de (%77,1) ve makine öğrenimi Ar-Ge için RE-Bench'te liderdir; Claude Opus 4.6 ise ajantik kodlama için Terminal-Bench 2.0'da ve çok disiplinli akıl yürütme için Humanity's Last Exam'da birinci sıradadır. Her ikisi de 1M token bağlam penceresi sunar. Seçim iş yüküne bağlıdır: Gemini yeni akıl yürütme görevlerinde, Claude sürdürülebilir kodlama çalışmalarında öne çıkar.
Gemini 3.1 Pro'daki thinking_level parametresi nedir?
thinking_level parametresi, geliştiricilerin modelin bir yanıt üretmeden önce uyguladığı maksimum akıl yürütme derinliğini kontrol etmesine olanak tanır. Düşük düşünme, basit görevler için daha hızlı ve ucuzdur. Yüksek düşünme, karmaşık akıl yürütme sorunlarına daha fazla hesaplama süresi ayırır. Bu, geliştiricilere maliyet-hız-kalite dengeleri üzerinde açık kontrol sağlar; Claude Opus 4.6'daki çaba kontrollerine benzer şekilde.
Gemini 3.1 Pro'daki özel araçlar uç noktası nedir?
Gemini 3.1 Pro, özel geliştirici araçlarına öncelik vermek için optimize edilmiş gemini-3.1-pro-preview-customtools adlı ayrı bir API uç noktası içerir. Bash komutları ve özel araçların karışımıyla ajantik uygulamalar oluştururken bu uç nokta, modelin doğru aracı seçip çağırmasını sağlar. Bu, özellikle harici sistemler ve API'lerle etkileşim kurması gereken yapay zeka ajanları oluşturan geliştiriciler için yararlıdır.

Güncel Kalın

En son yapay zeka haberlerini e-postanıza alın.

Paylaş