Code Velocity
ხელოვნური ინტელექტის მოდელები

GPT-5.2-Codex: OpenAI-ს აგენტური კოდირების მოდელი

·6 წუთი კითხვა·OpenAI·ორიგინალი წყარო
გაზიარება
GPT-5.2-Codex ბენჩმარკის დიაგრამა SWE-Bench Pro და Terminal-Bench 2.0 ქულებით GPT-5.2 საბაზისო მოდელთან შედარებით

GPT-5.2-Codex ბენჩმარკის შედეგები

OpenAI-მ GPT-5.2-Codex გამოუშვა 2026 წლის 14 იანვარს, საბაზისო GPT-5.2 მოდელიდან ხუთი კვირის შემდეგ. ის მიზნად ისახავს აგენტურ კოდირებას: მრავალსაფეხურიან სესიებს, სადაც მოდელი გეგმავს, კოდს წერს, ტესტებს ატარებს და წარუმატებლობებზე იტერაციას ახდენს.

მოდელი აჩვენებს 56.4%-ს SWE-Bench Pro-ზე (საბაზისო GPT-5.2-ის 55.6%-დან ზრდა) და 64.0%-ს Terminal-Bench 2.0-ზე (62.2%-დან ზრდა). ორივე ბენჩმარკი ტესტავს რეალური სამყაროს კოდირების დავალებებს, არა იზოლირებულ კოდის გენერაციას.

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

ბენჩმარკიGPT-5.2-CodexGPT-5.2Claude Opus 4.6
SWE-Bench Pro56.4%55.6%
Terminal-Bench 2.064.0%62.2%#1
კონტექსტის ფანჯარა (შემავალი)400K128K200K (1M beta)
გამომავალი ტოკენები128K128K128K

GPT-5.2-Codex ბალანსს ინარჩუნებს ღირებულებასა და წარმადობას შორის. Claude Opus 4.6 ლიდერობს Terminal-Bench 2.0-სა და Humanity's Last Exam-ზე, ხოლო GPT-5.2-Codex კონკურენციას უწევს ფასითა და კონტექსტის ფანჯრის ზომით.

დეველოპერებისთვის ძირითადი ფუნქციები

კონტექსტის შეკუმშვა

Claude Opus 4.6-ის შეკუმშვის ფუნქციის მსგავსად, GPT-5.2-Codex ადრინდელ კონტექსტს კუმშავს დავალების მდგომარეობის შენარჩუნებით. ეს შესაძლებელს ხდის მრავალსაათიან კოდირების სესიებს, სადაც მოდელი სრულ პროექტს თვალყურს ადევნებს საუბრის კონტექსტის ფანჯრის გადაჭარბების შემთხვევაშიც კი.

გრძელვადიანი დავალებების შესრულება

მოდელი ოპტიმიზირებულია მრავალ საფეხურიანი დავალებებისთვის: მასშტაბური რეფაქტორინგი, კოდბაზის მიგრაციები და მრავალფაილიანი ფუნქციონალის იმპლემენტაციები. მიდგომის წარუმატებლობისას GPT-5.2-Codex ასწორებს და ხელახლა ცდის დავალების თავიდან დაწყების ნაცვლად.

ჩაშენებული დაუცველობების აღმოჩენა

GPT-5.2-Codex კოდის გენერაციის დროს დაუცველობების აღმოჩენას მოიცავს. გუნდებს, რომლებსაც უფრო ღრმა სკანირება სჭირდებათ, შეუძლიათ გამოიყენონ სპეციალიზებული ინსტრუმენტები, როგორიცაა Claude Code Security, რომელიც მრავალსაფეხურიან ვერიფიკაციას ცრუ დადებითების ფილტრაციით გვთავაზობს.

Windows გარემოს მხარდაჭერა

OpenAI-მ გააუმჯობესა GPT-5.2-Codex-ის Windows-ზე დეველოპმენტის წარმადობა, ადრინდელი მოდელების Unix-ცენტრირებული ოპტიმიზაციის საკითხის მოგვარებით.

GPT-5.2-Codex ფასები

დონეღირებულება მილიონ ტოკენზე
შემავალი$1.75
გამომავალი$14.00
ქეშირებული შემავალი$0.175 (90% ფასდაკლება)

GPT-5.2-Codex ხელმისაწვდომია ყველა Codex პლატფორმაზე ფასიანი ChatGPT მომხმარებლებისთვის და დამოუკიდებელ API მოდელად.

რას ნიშნავს GPT-5.2-Codex აგენტური კოდირებისთვის

ეს გამოშვება ასახავს ინდუსტრიის მასშტაბურ გადასვლას კოდის შევსებიდან მდგრად კოდირების აგენტებზე. OpenAI-ს Codex, Anthropic-ის Claude Code და GitHub Agentic Workflows ყველა მიზნად ისახავს მრავალსაფეხურიან საინჟინრო დავალებებს მინიმალური ადამიანის ჩარევით.

ორიგინალი წყარო

https://openai.com/index/introducing-gpt-5-2-codex/

ხშირად დასმული კითხვები

რა არის GPT-5.2-Codex?
GPT-5.2-Codex არის OpenAI-ს GPT-5.2 მოდელის კოდირებისთვის ოპტიმიზირებული ვარიანტი, გამოშვებული 2026 წლის 14 იანვარს. ის სპეციალურად შექმნილია აგენტური კოდირების სამუშაო პროცესებისთვის, სადაც მოდელი მრავალსაფეხურიან პროგრამული ინჟინერიის სესიებს ატარებს. SWE-Bench Pro-ზე აჩვენებს 56.4%-ს და Terminal-Bench 2.0-ზე 64.0%-ს. მოდელი მხარს უჭერს 400K შემავალ და 128K გამომავალ კონტექსტის ფანჯარას.
რა ღირს GPT-5.2-Codex?
GPT-5.2-Codex ღირს $1.75 მილიონ შემავალ ტოკენზე და $14 მილიონ გამომავალ ტოკენზე. ქეშირებული შემავალი ტოკენები იღებენ 90%-იან ფასდაკლებას, რაც ეფექტურ ქეშირებულ ტარიფს $0.175-მდე ამცირებს. ეს მას მნიშვნელოვნად უფრო იაფს ხდის Claude Opus 4.6-ის $5/$25-თან შედარებით.
რა არის კონტექსტის შეკუმშვა GPT-5.2-Codex-ში?
კონტექსტის შეკუმშვა არის ფუნქცია, რომელიც ადრინდელ საუბრის კონტექსტს კუმშავს კრიტიკული დავალების მდგომარეობის შენარჩუნებით. ეს GPT-5.2-Codex-ს საშუალებას აძლევს მრავალსაათიანი კოდირების სესიები პროექტის სრული კონტროლით წარმართოს. როდესაც სესია კონტექსტის ფანჯრის ლიმიტს უახლოვდება, მოდელი ძველ კონტექსტს აჯამებს მისი წაშლის ნაცვლად.
როგორ შედარდება GPT-5.2-Codex Claude Opus 4.6-ს?
Terminal-Bench 2.0-ზე Claude Opus 4.6 ყველაზე მაღალ ქულას ინარჩუნებს, GPT-5.2-Codex-ის 64.0%-ს უსწრებს. SWE-Bench Pro-ზე GPT-5.2-Codex 56.4%-ს აჩვენებს. ორი მოდელი განსხვავებულ მიდგომებს იყენებს: GPT-5.2-Codex გვთავაზობს უფრო დიდ შემავალ კონტექსტს (400K ტოკენი Claude-ის 200K სტანდარტის წინააღმდეგ) და დაბალ ფასებს, ხოლო Claude Opus 4.6 გვთავაზობს აგენტ გუნდებს და მსჯელობის ბენჩმარკებზე უფრო მაღალ ქულებს.

იყავით ინფორმირებული

მიიღეთ უახლესი AI სიახლეები ელფოსტაზე.

გაზიარება