Gemini 3.1 Pro ทำคะแนน 77.1% บน ARC-AGI-2 เพิ่มขึ้นสองเท่าจาก Gemini 3 Pro บริบท 1M ระดับความคิดปรับได้ และ endpoint เครื่องมือแบบกำหนดเอง