Code Velocity
এআই মডেল

GPT-5.2-Codex: OpenAI-এর এজেন্টিক কোডিং মডেল

·6 মিনিট পড়া·OpenAI·মূল উৎস
শেয়ার
GPT-5.2-Codex বেঞ্চমার্ক চার্ট যেখানে SWE-Bench Pro এবং Terminal-Bench 2.0 স্কোর GPT-5.2 বেস মডেলের সাথে তুলনা করা হয়েছে

GPT-5.2-Codex বেঞ্চমার্ক ফলাফল

OpenAI ১৪ জানুয়ারি ২০২৬-এ GPT-5.2-Codex প্রকাশ করেছে, বেস GPT-5.2 মডেলের পাঁচ সপ্তাহ পরে। এটি এজেন্টিক কোডিং-কে লক্ষ্য করে: মাল্টি-স্টেপ সেশন যেখানে মডেলটি পরিকল্পনা করে, কোড লেখে, টেস্ট চালায় এবং ব্যর্থতায় পুনরায় চেষ্টা করে।

মডেলটি SWE-Bench Pro-তে ৫৬.৪% (বেস GPT-5.2-এর ৫৫.৬% থেকে উন্নীত) এবং Terminal-Bench 2.0-তে ৬৪.০% (৬২.২% থেকে উন্নীত) স্কোর করেছে। উভয় বেঞ্চমার্ক বাস্তব কোডিং কাজ পরীক্ষা করে, বিচ্ছিন্ন কোড জেনারেশন নয়।

GPT-5.2-Codex বনাম GPT-5.2 বনাম Claude Opus 4.6

বেঞ্চমার্কGPT-5.2-CodexGPT-5.2Claude Opus 4.6
SWE-Bench Pro৫৬.৪%৫৫.৬%
Terminal-Bench 2.0৬৪.০%৬২.২%#১
কনটেক্সট উইন্ডো (ইনপুট)৪০০K১২৮K২০০K (১M বিটা)
আউটপুট টোকেন১২৮K১২৮K১২৮K

GPT-5.2-Codex খরচ ও পারফরম্যান্সের মধ্যে ভারসাম্য রাখে। Claude Opus 4.6 Terminal-Bench 2.0 এবং Humanity's Last Exam-এ নেতৃত্ব দেয়, আর GPT-5.2-Codex দাম এবং কনটেক্সট উইন্ডোর আকারে প্রতিযোগিতা করে।

ডেভেলপারদের জন্য প্রধান ফিচার

কনটেক্সট কম্প্যাকশন

Claude Opus 4.6-এর কম্প্যাকশন ফিচারের মতো, GPT-5.2-Codex টাস্কের অবস্থা সংরক্ষণ করে আগের কনটেক্সট সংকুচিত করে। এটি মাল্টি-আওয়ার কোডিং সেশন সম্ভব করে যেখানে কথোপকথন কনটেক্সট উইন্ডো ছাড়িয়ে গেলেও মডেলটি পুরো প্রজেক্ট ট্র্যাক করে।

দীর্ঘমেয়াদী টাস্ক সম্পাদন

মডেলটি অনেক ধাপ জুড়ে থাকা কাজের জন্য অপটিমাইজড: বড় রিফ্যাক্টর, কোডবেস মাইগ্রেশন এবং মাল্টি-ফাইল ফিচার ইমপ্লিমেন্টেশন। যখন কোনো পদ্ধতি ব্যর্থ হয়, GPT-5.2-Codex টাস্কটি পুনরায় শুরু না করে সমন্বয় করে আবার চেষ্টা করে।

অন্তর্নির্মিত দুর্বলতা সনাক্তকরণ

GPT-5.2-Codex কোড জেনারেশনের সময় দুর্বলতা সনাক্তকরণ অন্তর্ভুক্ত করে। যেসব টিমের গভীরতর স্ক্যানিং প্রয়োজন তারা Claude Code Security-এর মতো ডেডিকেটেড টুল ব্যবহার করতে পারে, যা মাল্টি-স্টেজ ভেরিফিকেশন এবং ফলস পজিটিভ ফিল্টারিং অফার করে।

Windows এনভায়রনমেন্ট সাপোর্ট

OpenAI আগের মডেলগুলির Unix-কেন্দ্রিক অপটিমাইজেশন সমাধান করে GPT-5.2-Codex-এর Windows ডেভেলপমেন্ট পারফরম্যান্স উন্নত করেছে।

GPT-5.2-Codex মূল্য

স্তরপ্রতি মিলিয়ন টোকেন খরচ
ইনপুট$১.৭৫
আউটপুট$১৪.০০
ক্যাশড ইনপুট$০.১৭৫ (৯০% ছাড়)

GPT-5.2-Codex প্রদত্ত ChatGPT ব্যবহারকারীদের জন্য সকল Codex সারফেসে এবং একটি স্বতন্ত্র API মডেল হিসেবে উপলব্ধ।

এজেন্টিক কোডিং-এর জন্য GPT-5.2-Codex-এর অর্থ কী

এই প্রকাশ কোড কমপ্লিশন থেকে টেকসই কোডিং এজেন্টদের দিকে শিল্প-ব্যাপী পরিবর্তন প্রতিফলিত করে। OpenAI-এর Codex, Anthropic-এর Claude Code, এবং GitHub Agentic Workflows সবই ন্যূনতম মানবিক হস্তক্ষেপে মাল্টি-স্টেপ ইঞ্জিনিয়ারিং কাজকে লক্ষ্য করে।

সচরাচর জিজ্ঞাসিত প্রশ্ন

GPT-5.2-Codex কী?
GPT-5.2-Codex হলো OpenAI-এর GPT-5.2 মডেলের কোডিং-অপটিমাইজড ভেরিয়েন্ট, যা ১৪ জানুয়ারি ২০২৬-এ প্রকাশিত হয়েছে। এটি বিশেষভাবে এজেন্টিক কোডিং ওয়ার্কফ্লোর জন্য তৈরি যেখানে মডেলটি টানা মাল্টি-স্টেপ সফটওয়্যার ইঞ্জিনিয়ারিং সেশন চালায়। এটি SWE-Bench Pro-তে ৫৬.৪% এবং Terminal-Bench 2.0-তে ৬৪.০% স্কোর করেছে, বেস GPT-5.2 মডেলের যথাক্রমে ৫৫.৬% এবং ৬২.২%-এর উন্নতি করেছে। মডেলটি ৪০০K ইনপুট এবং ১২৮K আউটপুট কনটেক্সট উইন্ডো সমর্থন করে।
GPT-5.2-Codex-এর মূল্য কত?
GPT-5.2-Codex-এর মূল্য প্রতি মিলিয়ন ইনপুট টোকেনে $১.৭৫ এবং প্রতি মিলিয়ন আউটপুট টোকেনে $১৪। ক্যাশড ইনপুটে ৯০% ছাড় পাওয়া যায়, কার্যকর ক্যাশড রেট $০.১৭৫ প্রতি মিলিয়ন টোকেন। এটি Claude Opus 4.6-এর $৫/$২৫ প্রতি মিলিয়ন টোকেনের চেয়ে উল্লেখযোগ্যভাবে সস্তা, যদিও দুটি মডেল বেঞ্চমার্ক পারফরম্যান্স এবং ফিচার সেটে ভিন্ন।
GPT-5.2-Codex-এ কনটেক্সট কম্প্যাকশন কী?
কনটেক্সট কম্প্যাকশন একটি ফিচার যা আগের কথোপকথনের কনটেক্সট সংকুচিত করে গুরুত্বপূর্ণ টাস্কের অবস্থা সংরক্ষণ করে। এটি GPT-5.2-Codex-কে প্রজেক্টের পরিধি না হারিয়ে মাল্টি-আওয়ার কোডিং সেশন চালাতে দেয়। যখন একটি সেশন কনটেক্সট উইন্ডোর সীমায় পৌঁছায়, মডেলটি পুরনো কনটেক্সট বাদ দেওয়ার বদলে সংক্ষেপ করে, যা রিস্টার্ট ছাড়াই দীর্ঘ ও জটিল কোডিং কাজ সম্ভব করে।
GPT-5.2-Codex কিভাবে Claude Opus 4.6-এর সাথে তুলনা করে?
Terminal-Bench 2.0-তে Claude Opus 4.6 শীর্ষ স্কোর ধরে রেখেছে, GPT-5.2-Codex-এর ৬৪.০%-এর উপরে। SWE-Bench Pro-তে GPT-5.2-Codex ৫৬.৪% স্কোর করেছে। দুটি মডেল ভিন্ন পদ্ধতি গ্রহণ করে: GPT-5.2-Codex বড় ইনপুট কনটেক্সট (৪০০K টোকেন বনাম Claude-এর ২০০K স্ট্যান্ডার্ড) এবং কম মূল্য অফার করে, আর Claude Opus 4.6 এজেন্ট টিম এবং Humanity's Last Exam-এর মতো রিজনিং টাস্কে উচ্চতর বেঞ্চমার্ক স্কোর অফার করে।

আপডেট থাকুন

সর্বশেষ AI খবর ইনবক্সে পান।

শেয়ার