Code Velocity
مدل‌های هوش مصنوعی

Gemini 3.1 Pro: مدل استدلال‌محور گوگل

·6 دقیقه مطالعه·Google, Google DeepMind·منبع اصلی
اشتراک‌گذاری
مقایسه معیارهای Gemini 3.1 Pro که امتیازات ARC-AGI-2 و RE-Bench را در مقابل Gemini 3 Pro و سایر مدل‌های پیشرو نشان می‌دهد

نتایج معیار Gemini 3.1 Pro

Google DeepMind در ۱۹ فوریه ۲۰۲۶ Gemini 3.1 Pro را منتشر کرد. این مدل عملکرد استدلال نسل قبلی خود را بیش از دو برابر کرد و امتیاز ۷۷.۱٪ در ARC-AGI-2 در مقابل Gemini 3 Pro کسب کرد.

Gemini 3.1 Pro وظایفی را هدف قرار می‌دهد که نیاز به استدلال چندمرحله‌ای دارند: طراحی الگوریتم، ترکیب داده‌های بزرگ‌مقیاس، جریان‌های کاری عامل‌محور و کدنویسی پیچیده.

Gemini 3.1 Pro در مقابل Claude Opus 4.6 در مقابل GPT-5.2

معیارGemini 3.1 ProClaude Opus 4.6GPT-5.2-Codex
ARC-AGI-2۷۷.۱٪
RE-Bench (تحقیق و توسعه ML)۱.۲۷
Terminal-Bench 2.0#1۶۴.۰٪
Humanity's Last Exam#1
زمینه (ورودی)1M200K (1M بتا)400K
زمینه (خروجی)64K128K128K

هر مدل در حوزه‌های مختلفی پیشتاز است. Gemini 3.1 Pro در معیارهای استدلال جدید برتر است. Claude Opus 4.6 در کدنویسی عامل‌محور و استدلال بین‌رشته‌ای پیشتاز است. GPT-5.2-Codex عملکرد کدنویسی رقابتی را با قیمت پایین‌تر ارائه می‌دهد.

ویژگی‌های کلیدی برای توسعه‌دهندگان

عمق تفکر قابل تنظیم

Gemini 3.1 Pro پارامتر thinking_level را برای کنترل عمق استدلال معرفی می‌کند. تفکر کم سریع و ارزان برای وظایف معمولی است. تفکر زیاد محاسبات بیشتری را برای مسائل پیچیده اعمال می‌کند.

این مشابه کنترل‌های تلاش Claude Opus 4.6 است، هرچند Gemini تنظیم را به عنوان یک پارامتر API صریح و نه رفتار تطبیقی مدل ارائه می‌دهد.

Endpoint ابزار سفارشی

یک endpoint جداگانه، gemini-3.1-pro-preview-customtools، برای برنامه‌های عامل‌محور که دستورات shell را با ابزارهای سفارشی ترکیب می‌کنند بهینه شده است. انتخاب و فراخوانی صحیح ابزار را در اولویت قرار می‌دهد و خطاها را هنگام تعامل عامل‌ها با سیستم‌های خارجی کاهش می‌دهد. این برای توسعه‌دهندگانی که عامل‌هایی مشابه GitHub Agentic Workflows می‌سازند مرتبط است، جایی که دقت انتخاب ابزار مستقیماً بر قابلیت اطمینان اتوماسیون تأثیر می‌گذارد.

ورودی URL یوتیوب

توسعه‌دهندگان می‌توانند URLهای YouTube را مستقیماً در پرامپت‌ها وارد کنند. مدل محتوای ویدیویی را تحلیل می‌کند و جریان‌های کاری را ممکن می‌سازد که درک ویدیو را با تولید کد یا مستندات ترکیب می‌کنند.

پردازش چندوجهی

Gemini 3.1 Pro متن، تصاویر، صدا، ویدیو و کد را در یک زمینه واحد پردازش می‌کند. با پنجره ورودی ۱M توکن، می‌تواند کل کدبیس‌ها یا اسناد تحقیقاتی طولانی را در یک بار پردازش کند.

RE-Bench: عملکرد تحقیقات ML

در RE-Bench که قابلیت‌های تحقیق و توسعه ML را ارزیابی می‌کند، Gemini 3.1 Pro امتیاز ۱.۲۷ (نرمال‌شده انسانی) کسب کرد، افزایش از ۱.۰۴ Gemini 3 Pro. مدل وظایف بهینه‌سازی را در ۴۷ ثانیه در مقابل ۹۴ ثانیه مرجع انسانی تکمیل کرد.

دسترسی به Gemini 3.1 Pro

Gemini 3.1 Pro در اپلیکیشن Gemini، Google Cloud Vertex AI، Google AI Studio و Gemini API در دسترس است. قیمت‌گذاری بر اساس پلتفرم متفاوت است. مدل در حالت پیش‌نمایش است و انتظار می‌رود دسترسی عمومی به زودی ارائه شود.

سوالات متداول

Gemini 3.1 Pro چیست؟
Gemini 3.1 Pro ارتقاء بهینه‌شده برای استدلال سری Gemini 3 از Google DeepMind است که در ۱۹ فوریه ۲۰۲۶ منتشر شد. این مدل امتیاز ۷۷.۱٪ در ARC-AGI-2 کسب کرد و عملکرد استدلال Gemini 3 Pro را بیش از دو برابر کرد. این مدل از زمینه ورودی ۱M توکن و خروجی ۶۴K توکن پشتیبانی می‌کند و پارامتر thinking_level را معرفی می‌کند که به توسعه‌دهندگان اجازه می‌دهد عمق استدلال مدل را قبل از پاسخ‌دهی کنترل کنند.
Gemini 3.1 Pro چگونه با Claude Opus 4.6 مقایسه می‌شود؟
Gemini 3.1 Pro و Claude Opus 4.6 نقاط قوت متفاوتی دارند. Gemini 3.1 Pro در ARC-AGI-2 (۷۷.۱٪) و RE-Bench برای تحقیق و توسعه ML پیشتاز است، در حالی که Claude Opus 4.6 جایگاه اول را در Terminal-Bench 2.0 برای کدنویسی عامل‌محور و Humanity's Last Exam برای استدلال بین‌رشته‌ای دارد. هر دو پنجره زمینه ۱M توکنی ارائه می‌دهند. انتخاب به نوع کار بستگی دارد: Gemini در وظایف استدلال جدید و Claude در کار کدنویسی مستمر برتری دارد.
پارامتر thinking_level در Gemini 3.1 Pro چیست؟
پارامتر thinking_level به توسعه‌دهندگان اجازه می‌دهد حداکثر عمق استدلال مدل را قبل از تولید پاسخ کنترل کنند. تفکر کم سریع‌تر و ارزان‌تر برای وظایف ساده است. تفکر زیاد زمان محاسبه بیشتری را برای مسائل استدلال پیچیده اختصاص می‌دهد. این به توسعه‌دهندگان کنترل صریح بر تعادل هزینه-سرعت-کیفیت می‌دهد، مشابه کنترل‌های تلاش در Claude Opus 4.6.
endpoint ابزار سفارشی در Gemini 3.1 Pro چیست؟
Gemini 3.1 Pro شامل یک endpoint API جداگانه به نام gemini-3.1-pro-preview-customtools است که برای اولویت‌دهی به ابزارهای سفارشی توسعه‌دهندگان بهینه شده است. هنگام ساخت برنامه‌های عامل‌محور با ترکیب دستورات bash و ابزارهای سفارشی، این endpoint اطمینان می‌دهد که مدل ابزار مناسب را به درستی انتخاب و فراخوانی می‌کند. این ویژگی برای توسعه‌دهندگانی که عامل‌های هوش مصنوعی می‌سازند که نیاز به تعامل با سیستم‌ها و APIهای خارجی دارند بسیار مفید است.

به‌روز بمانید

آخرین اخبار هوش مصنوعی را در ایمیل خود دریافت کنید.

اشتراک‌گذاری