نتایج بنچمارک GPT-5.2-Codex
OpenAI در ۱۴ ژانویه ۲۰۲۶، پنج هفته پس از مدل پایه GPT-5.2، مدل GPT-5.2-Codex را منتشر کرد. این مدل کدنویسی عاملی را هدف قرار میدهد: جلسات چندمرحلهای که مدل برنامهریزی میکند، کد مینویسد، تستها را اجرا میکند و روی خطاها تکرار میکند.
این مدل ۵۶.۴٪ در SWE-Bench Pro (بالاتر از ۵۵.۶٪ GPT-5.2 پایه) و ۶۴.۰٪ در Terminal-Bench 2.0 (بالاتر از ۶۲.۲٪) کسب کرد. هر دو بنچمارک وظایف کدنویسی دنیای واقعی را آزمایش میکنند، نه تولید کد ایزوله.
GPT-5.2-Codex در مقابل GPT-5.2 در مقابل Claude Opus 4.6
| بنچمارک | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | ۵۶.۴٪ | ۵۵.۶٪ | — |
| Terminal-Bench 2.0 | ۶۴.۰٪ | ۶۲.۲٪ | #1 |
| پنجره زمینه (ورودی) | 400K | 128K | 200K (1M بتا) |
| توکنهای خروجی | 128K | 128K | 128K |
GPT-5.2-Codex هزینه و عملکرد را متوازن میکند. Claude Opus 4.6 در Terminal-Bench 2.0 و Humanity's Last Exam پیشتاز است، در حالی که GPT-5.2-Codex در قیمت و اندازه پنجره زمینه رقابت میکند.
ویژگیهای کلیدی برای توسعهدهندگان
فشردهسازی زمینه
مانند ویژگی فشردهسازی Claude Opus 4.6، GPT-5.2-Codex زمینه قبلی را فشرده میکند و در عین حال وضعیت وظیفه را حفظ میکند. این امکان جلسات کدنویسی چندساعته را فراهم میسازد که مدل کل پروژه را حتی زمانی که مکالمه از پنجره زمینه فراتر میرود، پیگیری میکند.
تکمیل وظایف بلندمدت
این مدل برای وظایفی که مراحل زیادی را شامل میشوند بهینه شده است: بازسازیهای بزرگ، مهاجرتهای پایگاه کد و پیادهسازی ویژگیهای چندفایلی. وقتی یک رویکرد شکست میخورد، GPT-5.2-Codex تنظیم و تلاش مجدد میکند به جای اینکه وظیفه را از نو شروع کند.
تشخیص آسیبپذیری داخلی
GPT-5.2-Codex شامل تشخیص آسیبپذیری در حین تولید کد است. تیمهایی که به اسکن عمیقتر نیاز دارند میتوانند از ابزارهای اختصاصی مانند Claude Code Security استفاده کنند که تأیید چندمرحلهای با فیلتر کردن مثبتهای کاذب ارائه میدهد.
پشتیبانی از محیط ویندوز
OpenAI عملکرد توسعه ویندوز GPT-5.2-Codex را بهبود بخشید و بهینهسازی یونیکسمحور مدلهای قبلی را برطرف کرد.
قیمتگذاری GPT-5.2-Codex
| سطح | هزینه بهازای هر میلیون توکن |
|---|---|
| ورودی | $1.75 |
| خروجی | $14.00 |
| ورودی کششده | $0.175 (تخفیف ۹۰٪) |
GPT-5.2-Codex در تمام سطوح Codex برای کاربران پولی ChatGPT و بهعنوان مدل API مستقل در دسترس است.
معنای GPT-5.2-Codex برای کدنویسی عاملی
این انتشار بازتابدهنده تغییر سراسری صنعت از تکمیل کد به عاملهای کدنویسی مداوم است. Codex از OpenAI، Claude Code از Anthropic و GitHub Agentic Workflows همگی وظایف مهندسی چندمرحلهای را با حداقل مداخله انسانی هدف قرار میدهند.
سوالات متداول
GPT-5.2-Codex چیست؟
هزینه GPT-5.2-Codex چقدر است؟
فشردهسازی زمینه در GPT-5.2-Codex چیست؟
GPT-5.2-Codex در مقایسه با Claude Opus 4.6 چگونه است؟
بهروز بمانید
آخرین اخبار هوش مصنوعی را در ایمیل خود دریافت کنید.
