ผลเบนช์มาร์ก GPT-5.2-Codex
OpenAI เปิดตัว GPT-5.2-Codex เมื่อวันที่ 14 มกราคม 2026 ห้าสัปดาห์หลังจากโมเดลพื้นฐาน GPT-5.2 เป้าหมายคือการเขียนโค้ดเชิงเอเจนต์: เซสชันหลายขั้นตอนที่โมเดลวางแผน เขียนโค้ด รันเทสต์ และแก้ไขข้อผิดพลาด
โมเดลทำคะแนน 56.4% บน SWE-Bench Pro (เพิ่มจาก 55.6% ของ GPT-5.2 พื้นฐาน) และ 64.0% บน Terminal-Bench 2.0 (เพิ่มจาก 62.2%) ทั้งสองเบนช์มาร์กทดสอบงานเขียนโค้ดจริง ไม่ใช่การสร้างโค้ดแบบแยกส่วน
GPT-5.2-Codex vs GPT-5.2 vs Claude Opus 4.6
| เบนช์มาร์ก | GPT-5.2-Codex | GPT-5.2 | Claude Opus 4.6 |
|---|---|---|---|
| SWE-Bench Pro | 56.4% | 55.6% | — |
| Terminal-Bench 2.0 | 64.0% | 62.2% | #1 |
| หน้าต่างบริบท (อินพุต) | 400K | 128K | 200K (1M เบต้า) |
| โทเคนเอาต์พุต | 128K | 128K | 128K |
GPT-5.2-Codex สร้างสมดุลระหว่างต้นทุนและประสิทธิภาพ Claude Opus 4.6 นำบน Terminal-Bench 2.0 และ Humanity's Last Exam ขณะที่ GPT-5.2-Codex แข่งขันด้านราคาและขนาดหน้าต่างบริบท
ฟีเจอร์สำคัญสำหรับนักพัฒนา
Context Compaction
เช่นเดียวกับฟีเจอร์ compaction ของ Claude Opus 4.6 GPT-5.2-Codex บีบอัดบริบทก่อนหน้าพร้อมรักษาสถานะงาน ทำให้เซสชันเขียนโค้ดหลายชั่วโมงเป็นไปได้ โดยโมเดลติดตามโปรเจกต์ทั้งหมดแม้การสนทนาจะเกินหน้าต่างบริบท
การทำงานระยะยาวสำเร็จ
โมเดลถูกปรับแต่งสำหรับงานที่ครอบคลุมหลายขั้นตอน: การรีแฟกเตอร์ขนาดใหญ่ การย้ายโค้ดเบส และการพัฒนาฟีเจอร์หลายไฟล์ เมื่อแนวทางหนึ่งล้มเหลว GPT-5.2-Codex จะปรับและลองใหม่แทนที่จะเริ่มงานใหม่
การตรวจจับช่องโหว่ในตัว
GPT-5.2-Codex มีการตรวจจับช่องโหว่ระหว่างการสร้างโค้ด ทีมที่ต้องการการสแกนเชิงลึกสามารถใช้เครื่องมือเฉพาะอย่าง Claude Code Security ซึ่งมีการตรวจสอบหลายขั้นตอนพร้อมการกรอง false positive
รองรับสภาพแวดล้อม Windows
OpenAI ปรับปรุงประสิทธิภาพการพัฒนาบน Windows ของ GPT-5.2-Codex แก้ไขการปรับแต่งที่เน้น Unix ของโมเดลก่อนหน้า
ราคา GPT-5.2-Codex
| ระดับ | ต้นทุนต่อล้านโทเคน |
|---|---|
| อินพุต | $1.75 |
| เอาต์พุต | $14.00 |
| อินพุตแคช | $0.175 (ส่วนลด 90%) |
GPT-5.2-Codex พร้อมใช้งานบนทุกแพลตฟอร์ม Codex สำหรับผู้ใช้ ChatGPT แบบเสียเงินและเป็นโมเดล API แบบแยก
GPT-5.2-Codex หมายถึงอะไรสำหรับการเขียนโค้ดเชิงเอเจนต์
การเปิดตัวนี้สะท้อนการเปลี่ยนแปลงทั่วทั้งอุตสาหกรรมจากการเติมโค้ดไปสู่เอเจนต์เขียนโค้ดที่ทำงานต่อเนื่อง Codex ของ OpenAI, Claude Code ของ Anthropic และ GitHub Agentic Workflows ทั้งหมดมุ่งเป้าไปที่งานวิศวกรรมหลายขั้นตอนที่ต้องการการแทรกแซงจากมนุษย์น้อยที่สุด
คำถามที่พบบ่อย
GPT-5.2-Codex คืออะไร?
GPT-5.2-Codex ราคาเท่าไร?
Context compaction ใน GPT-5.2-Codex คืออะไร?
GPT-5.2-Codex เทียบกับ Claude Opus 4.6 เป็นอย่างไร?
อัปเดตข่าวสาร
รับข่าว AI ล่าสุดในกล่องจดหมายของคุณ
