GPT-5.2-Codex: המודל של OpenAI לתכנות אגנטי

תוצאות הבנצ'מרק של GPT-5.2-Codex

OpenAI השיקה את GPT-5.2-Codex ב-14 בינואר 2026, חמישה שבועות לאחר מודל הבסיס GPT-5.2. המודל מכוון לתכנות אגנטי: סשנים רב-שלביים שבהם המודל מתכנן, כותב קוד, מריץ בדיקות ומתקן כשלים.

המודל משיג 56.4% ב-SWE-Bench Pro (עלייה מ-55.6% במודל הבסיס GPT-5.2) ו-64.0% ב-Terminal-Bench 2.0 (עלייה מ-62.2%). שני הבנצ'מרקים בודקים משימות תכנות מהעולם האמיתי, לא יצירת קוד מבודדת.

GPT-5.2-Codex מול GPT-5.2 מול Claude Opus 4.6

בנצ'מרק	GPT-5.2-Codex	GPT-5.2	Claude Opus 4.6
SWE-Bench Pro	56.4%	55.6%	—
Terminal-Bench 2.0	64.0%	62.2%	#1
חלון הקשר (קלט)	400K	128K	200K (1M בטא)
טוקני פלט	128K	128K	128K

GPT-5.2-Codex מאזן בין עלות וביצועים. Claude Opus 4.6 מוביל ב-Terminal-Bench 2.0 וב-Humanity's Last Exam, בעוד GPT-5.2-Codex מתחרה על מחיר וגודל חלון הקשר.

פיצ'רים מרכזיים למפתחים

דחיסת הקשר

בדומה לפיצ'ר הדחיסה של Claude Opus 4.6, GPT-5.2-Codex דוחס הקשר קודם תוך שמירה על מצב המשימה. זה מאפשר סשני תכנות ארוכים שבהם המודל עוקב אחר הפרויקט המלא גם כשהשיחה חורגת מחלון ההקשר.

השלמת משימות לטווח ארוך

המודל מותאם למשימות הכוללות שלבים רבים: ריפקטורינגים גדולים, מיגרציות של בסיסי קוד ומימוש פיצ'רים חוצי קבצים. כאשר גישה נכשלת, GPT-5.2-Codex מתאים ומנסה שוב במקום להתחיל מחדש.

זיהוי פגיעויות מובנה

GPT-5.2-Codex כולל זיהוי פגיעויות במהלך יצירת הקוד. צוותים הזקוקים לסריקה מעמיקה יותר יכולים להשתמש בכלים ייעודיים כמו Claude Code Security, המציע אימות רב-שלבי עם סינון חיובי שגוי.

תמיכה בסביבת Windows

OpenAI שיפרה את ביצועי הפיתוח של GPT-5.2-Codex ב-Windows, מתוך התמודדות עם האופטימיזציה הממוקדת Unix של מודלים קודמים.

תמחור GPT-5.2-Codex

רמה	עלות למיליון טוקנים
קלט	$1.75
פלט	$14.00
קלט מזוכה	$0.175 (הנחה 90%)

GPT-5.2-Codex זמין בכל פלטפורמות Codex למשתמשי ChatGPT בתשלום וכמודל API עצמאי.

מה GPT-5.2-Codex אומר על תכנות אגנטי

ההשקה משקפת מעבר תעשייתי רחב מהשלמת קוד לסוכני תכנות מתמשכים. Codex של OpenAI, Claude Code של Anthropic ו-GitHub Agentic Workflows כולם מכוונים למשימות הנדסיות רב-שלביות עם התערבות אנושית מינימלית.

שאלות נפוצות

מהו GPT-5.2-Codex?

GPT-5.2-Codex הוא הגרסה המותאמת לתכנות של מודל GPT-5.2 מבית OpenAI, שהושק ב-14 בינואר 2026. הוא בנוי במיוחד לתהליכי עבודה אגנטיים בתכנות, שבהם המודל מנהל סשנים רב-שלביים ממושכים של הנדסת תוכנה. הוא משיג 56.4% ב-SWE-Bench Pro ו-64.0% ב-Terminal-Bench 2.0, שיפור ביחס לביצועי מודל הבסיס GPT-5.2 של 55.6% ו-62.2% בהתאמה. המודל תומך בחלון הקשר של 400K טוקנים לקלט ו-128K טוקנים לפלט.

כמה עולה GPT-5.2-Codex?

GPT-5.2-Codex עולה $1.75 למיליון טוקני קלט ו-$14 למיליון טוקני פלט. קלט מזוכה מקבל הנחה של 90%, מה שמוריד את התעריף האפקטיבי ל-$0.175 למיליון טוקנים. זה זול משמעותית מ-Claude Opus 4.6 ב-$5/$25 למיליון טוקנים, אם כי שני המודלים נבדלים בביצועי הבנצ'מרק ובמערכות הפיצ'רים.

מהי דחיסת הקשר ב-GPT-5.2-Codex?

דחיסת הקשר היא פיצ'ר שדוחס הקשר קודם בשיחה תוך שמירה על מצב המשימה הקריטי. זה מאפשר ל-GPT-5.2-Codex לקיים סשני תכנות ארוכים מבלי לאבד את מעקב היקף הפרויקט. כאשר סשן מתקרב למגבלת חלון ההקשר, המודל מסכם הקשר ישן במקום למחוק אותו, מה שמאפשר משימות תכנות ארוכות ומורכבות יותר ללא הפעלה מחדש.

כיצד GPT-5.2-Codex משתווה ל-Claude Opus 4.6?

ב-Terminal-Bench 2.0, Claude Opus 4.6 מחזיק בציון הגבוה ביותר, מעל 64.0% של GPT-5.2-Codex. ב-SWE-Bench Pro, GPT-5.2-Codex משיג 56.4%. שני המודלים נוקטים בגישות שונות: GPT-5.2-Codex מציע חלון הקשר קלט גדול יותר (400K טוקנים לעומת 200K הסטנדרטי של Claude) ותמחור נמוך יותר, בעוד Claude Opus 4.6 מציע צוותי סוכנים וציוני בנצ'מרק גבוהים יותר במשימות חשיבה כמו Humanity's Last Exam.