תוצאות הבנצ'מרק של Gemini 3.1 Pro
Google DeepMind השיקה את Gemini 3.1 Pro ב-19 בפברואר 2026. המודל יותר מכפיל את ביצועי החשיבה של קודמו, ומשיג 77.1% ב-ARC-AGI-2 לעומת Gemini 3 Pro.
Gemini 3.1 Pro מכוון למשימות הדורשות חשיבה רב-שלבית: עיצוב אלגוריתמים, סינתזת נתונים בקנה מידה גדול, תהליכי עבודה אגנטיים ותכנות מורכב.
Gemini 3.1 Pro מול Claude Opus 4.6 מול GPT-5.2
| בנצ'מרק | Gemini 3.1 Pro | Claude Opus 4.6 | GPT-5.2-Codex |
|---|---|---|---|
| ARC-AGI-2 | 77.1% | — | — |
| RE-Bench (מחקר ופיתוח ML) | 1.27 | — | — |
| Terminal-Bench 2.0 | — | #1 | 64.0% |
| Humanity's Last Exam | — | #1 | — |
| הקשר (קלט) | 1M | 200K (1M בטא) | 400K |
| הקשר (פלט) | 64K | 128K | 128K |
כל מודל מוביל בתחומים שונים. Gemini 3.1 Pro מוביל בבנצ'מרקי חשיבה חדשניים. Claude Opus 4.6 מוביל בתכנות אגנטי ובחשיבה רב-תחומית. GPT-5.2-Codex מציע ביצועי תכנות תחרותיים בתמחור נמוך יותר.
פיצ'רים מרכזיים למפתחים
עומק חשיבה מתכוונן
Gemini 3.1 Pro מציג פרמטר thinking_level השולט בעומק החשיבה. חשיבה נמוכה מהירה וזולה למשימות שגרתיות. חשיבה גבוהה מפעילה יותר חישוב לבעיות מורכבות.
זה דומה לבקרות המאמץ של Claude Opus 4.6, אם כי Gemini חושף את ההגדרה כפרמטר API מפורש במקום התנהגות מודל אדפטיבית.
נקודת קצה לכלים מותאמים אישית
נקודת קצה נפרדת, gemini-3.1-pro-preview-customtools, מותאמת ליישומים אגנטיים המשלבים פקודות shell עם כלים מותאמים אישית. היא מתעדפת בחירת כלים נכונה והפעלתם, ומפחיתה שגיאות כשסוכנים מקיימים אינטראקציה עם מערכות חיצוניות. זה רלוונטי למפתחים הבונים סוכנים דומים ל-GitHub Agentic Workflows, שבהם דיוק בחירת הכלים משפיע ישירות על אמינות האוטומציה.
קלט URL של YouTube
מפתחים יכולים להעביר כתובות URL של YouTube ישירות לפרומפטים. המודל מנתח תוכן וידאו, ומאפשר תהליכי עבודה המשלבים הבנת וידאו עם יצירת קוד או תיעוד.
עיבוד מולטימודלי
Gemini 3.1 Pro מעבד טקסט, תמונות, אודיו, וידאו וקוד בהקשר יחיד. עם חלון קלט של 1M טוקנים, הוא יכול לעבד בסיסי קוד שלמים או מסמכי מחקר ארוכים במעבר אחד.
RE-Bench: ביצועי מחקר ML
ב-RE-Bench, שמעריך יכולות מחקר ופיתוח ML, Gemini 3.1 Pro משיג 1.27 (מנורמל לאדם), עלייה מ-1.04 של Gemini 3 Pro. המודל השלים משימות אופטימיזציה ב-47 שניות לעומת 94 השניות של הייחוס האנושי.
זמינות Gemini 3.1 Pro
Gemini 3.1 Pro זמין באפליקציית Gemini, ב-Google Cloud Vertex AI, ב-Google AI Studio וב-Gemini API. התמחור משתנה בהתאם לפלטפורמה. המודל בתצוגה מקדימה; זמינות כללית צפויה בהמשך.
שאלות נפוצות
מהו Gemini 3.1 Pro?
כיצד Gemini 3.1 Pro משתווה ל-Claude Opus 4.6?
מהו פרמטר thinking_level ב-Gemini 3.1 Pro?
מהי נקודת הקצה לכלים מותאמים אישית ב-Gemini 3.1 Pro?
הישארו מעודכנים
קבלו את חדשות ה-AI האחרונות לתיבת הדוא״ל.
