Code Velocity
โมเดล AI

GPT-5.2-Codex: โมเดลเขียนโค้ดเชิงเอเจนต์ของ OpenAI

·6 นาทีอ่าน·OpenAI·แหล่งที่มา
แชร์
กราฟเบนช์มาร์ก GPT-5.2-Codex แสดงคะแนน SWE-Bench Pro และ Terminal-Bench 2.0 เทียบกับโมเดลพื้นฐาน GPT-5.2

ผลเบนช์มาร์ก GPT-5.2-Codex

OpenAI เปิดตัว GPT-5.2-Codex เมื่อวันที่ 14 มกราคม 2026 ห้าสัปดาห์หลังจากโมเดลพื้นฐาน GPT-5.2 เป้าหมายคือการเขียนโค้ดเชิงเอเจนต์: เซสชันหลายขั้นตอนที่โมเดลวางแผน เขียนโค้ด รันเทสต์ และแก้ไขข้อผิดพลาด

โมเดลทำคะแนน 56.4% บน SWE-Bench Pro (เพิ่มจาก 55.6% ของ GPT-5.2 พื้นฐาน) และ 64.0% บน Terminal-Bench 2.0 (เพิ่มจาก 62.2%) ทั้งสองเบนช์มาร์กทดสอบงานเขียนโค้ดจริง ไม่ใช่การสร้างโค้ดแบบแยกส่วน

GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6

เบนช์มาร์กGPT-5.2-CodexGPT-5.2Claude Opus 4.6
SWE-Bench Pro56.4%55.6%
Terminal-Bench 2.064.0%62.2%#1
หน้าต่างบริบท (อินพุต)400K128K200K (1M เบต้า)
โทเคนเอาต์พุต128K128K128K

GPT-5.2-Codex สร้างสมดุลระหว่างต้นทุนและประสิทธิภาพ Claude Opus 4.6 นำบน Terminal-Bench 2.0 และ Humanity's Last Exam ขณะที่ GPT-5.2-Codex แข่งขันด้านราคาและขนาดหน้าต่างบริบท

ฟีเจอร์สำคัญสำหรับนักพัฒนา

Context Compaction

เช่นเดียวกับฟีเจอร์ compaction ของ Claude Opus 4.6 GPT-5.2-Codex บีบอัดบริบทก่อนหน้าพร้อมรักษาสถานะงาน ทำให้เซสชันเขียนโค้ดหลายชั่วโมงเป็นไปได้ โดยโมเดลติดตามโปรเจกต์ทั้งหมดแม้การสนทนาจะเกินหน้าต่างบริบท

การทำงานระยะยาวสำเร็จ

โมเดลถูกปรับแต่งสำหรับงานที่ครอบคลุมหลายขั้นตอน: การรีแฟกเตอร์ขนาดใหญ่ การย้ายโค้ดเบส และการพัฒนาฟีเจอร์หลายไฟล์ เมื่อแนวทางหนึ่งล้มเหลว GPT-5.2-Codex จะปรับและลองใหม่แทนที่จะเริ่มงานใหม่

การตรวจจับช่องโหว่ในตัว

GPT-5.2-Codex มีการตรวจจับช่องโหว่ระหว่างการสร้างโค้ด ทีมที่ต้องการการสแกนเชิงลึกสามารถใช้เครื่องมือเฉพาะอย่าง Claude Code Security ซึ่งมีการตรวจสอบหลายขั้นตอนพร้อมการกรอง false positive

รองรับสภาพแวดล้อม Windows

OpenAI ปรับปรุงประสิทธิภาพการพัฒนาบน Windows ของ GPT-5.2-Codex แก้ไขการปรับแต่งที่เน้น Unix ของโมเดลก่อนหน้า

ราคา GPT-5.2-Codex

ระดับต้นทุนต่อล้านโทเคน
อินพุต$1.75
เอาต์พุต$14.00
อินพุตแคช$0.175 (ส่วนลด 90%)

GPT-5.2-Codex พร้อมใช้งานบนทุกแพลตฟอร์ม Codex สำหรับผู้ใช้ ChatGPT แบบเสียเงินและเป็นโมเดล API แบบแยก

GPT-5.2-Codex หมายถึงอะไรสำหรับการเขียนโค้ดเชิงเอเจนต์

การเปิดตัวนี้สะท้อนการเปลี่ยนแปลงทั่วทั้งอุตสาหกรรมจากการเติมโค้ดไปสู่เอเจนต์เขียนโค้ดที่ทำงานต่อเนื่อง Codex ของ OpenAI, Claude Code ของ Anthropic และ GitHub Agentic Workflows ทั้งหมดมุ่งเป้าไปที่งานวิศวกรรมหลายขั้นตอนที่ต้องการการแทรกแซงจากมนุษย์น้อยที่สุด

คำถามที่พบบ่อย

GPT-5.2-Codex คืออะไร?
GPT-5.2-Codex เป็นเวอร์ชันที่ปรับแต่งสำหรับการเขียนโค้ดของโมเดล GPT-5.2 จาก OpenAI เปิดตัวเมื่อวันที่ 14 มกราคม 2026 สร้างมาโดยเฉพาะสำหรับเวิร์กโฟลว์เขียนโค้ดเชิงเอเจนต์ที่โมเดลรันเซสชันวิศวกรรมซอฟต์แวร์แบบหลายขั้นตอนต่อเนื่อง ทำคะแนน 56.4% บน SWE-Bench Pro และ 64.0% บน Terminal-Bench 2.0 ดีขึ้นจากโมเดลพื้นฐาน GPT-5.2 ที่ 55.6% และ 62.2% ตามลำดับ รองรับหน้าต่างบริบท 400K อินพุต และ 128K เอาต์พุต
GPT-5.2-Codex ราคาเท่าไร?
GPT-5.2-Codex ราคา $1.75 ต่อล้านโทเคนอินพุต และ $14 ต่อล้านโทเคนเอาต์พุต อินพุตที่แคชได้รับส่วนลด 90% ทำให้ราคาแคชจริงอยู่ที่ $0.175 ต่อล้านโทเคน ถูกกว่า Claude Opus 4.6 ที่ $5/$25 ต่อล้านโทเคนอย่างมาก แม้ว่าสองโมเดลจะแตกต่างในประสิทธิภาพเบนช์มาร์กและชุดฟีเจอร์
Context compaction ใน GPT-5.2-Codex คืออะไร?
Context compaction เป็นฟีเจอร์ที่บีบอัดบริบทการสนทนาก่อนหน้าพร้อมรักษาสถานะงานที่สำคัญ ทำให้ GPT-5.2-Codex สามารถรักษาเซสชันเขียนโค้ดหลายชั่วโมงได้โดยไม่สูญเสียขอบเขตโปรเจกต์ เมื่อเซสชันใกล้ถึงขีดจำกัดหน้าต่างบริบท โมเดลจะสรุปบริบทเก่าแทนที่จะทิ้งไป
GPT-5.2-Codex เทียบกับ Claude Opus 4.6 เป็นอย่างไร?
บน Terminal-Bench 2.0 Claude Opus 4.6 อยู่อันดับสูงสุด นำหน้า GPT-5.2-Codex ที่ 64.0% บน SWE-Bench Pro GPT-5.2-Codex ทำคะแนน 56.4% สองโมเดลใช้แนวทางต่างกัน: GPT-5.2-Codex มีบริบทอินพุตที่ใหญ่กว่า (400K โทเคน เทียบกับ 200K ของ Claude) และราคาถูกกว่า ขณะที่ Claude Opus 4.6 มี agent teams และคะแนนเบนช์มาร์กที่สูงกว่าในงานการให้เหตุผลอย่าง Humanity's Last Exam

อัปเดตข่าวสาร

รับข่าว AI ล่าสุดในกล่องจดหมายของคุณ

แชร์