Code Velocity
Mô hình AI

Claude Sonnet 4.6: Hiệu Suất Coding Hàng Đầu Với Giá Sonnet

·6 phút đọc·Anthropic·Nguồn gốc
Chia sẻ
Biểu đồ tiến bộ benchmark OSWorld của Claude Sonnet 4.6 cho thấy cải thiện 65% từ Sonnet 3.5 đến 4.6

Có Gì Mới Trong Claude Sonnet 4.6

Claude Sonnet 4.6 là mô hình Sonnet mạnh nhất của Anthropic, với các nâng cấp lớn về coding, sử dụng máy tính, suy luận ngữ cảnh dài và lập kế hoạch agent. Hiện là mô hình mặc định trên claude.ai cho người dùng Free và Pro.

Các lập trình viên được dùng sớm ưa thích Sonnet 4.6 hơn hẳn phiên bản tiền nhiệm, và thường còn hơn cả Claude Opus 4.5, mô hình thông minh nhất của Anthropic từ tháng 11 năm 2025.

Hiệu Suất Coding Của Claude Sonnet 4.6

Hiệu suất trước đây cần mô hình Opus giờ có sẵn ở mức giá Sonnet ($3/$15 mỗi triệu token). Các cải tiến chính:

  • Sinh mã nguồn tốt hơn: Đầu ra mã nhất quán và chính xác hơn trên nhiều ngôn ngữ
  • Tuân thủ chỉ dẫn tốt hơn: Thực hiện chính xác hơn các chỉ dẫn coding phức tạp nhiều bước
  • Gỡ lỗi mạnh hơn: Tốt hơn trong việc phát hiện lỗi của chính mình và đề xuất sửa chữa
  • Hiệu suất tác vụ thực tế: Đạt mức tiên tiến nhất trên các tác vụ văn phòng có giá trị kinh tế (GDPval-AA)

Đối với các nhóm sử dụng quét bảo mật bằng AI, Claude Code Security hoạt động với cả Sonnet 4.6 và Opus 4.6 để phát hiện lỗ hổng trong codebase.

Benchmark Sử Dụng Máy Tính: Kết Quả OSWorld

Anthropic tiên phong trong sử dụng máy tính đa năng vào tháng 10 năm 2024. Trên OSWorld, benchmark tiêu chuẩn nơi AI hoàn thành tác vụ trên phần mềm thực như Chrome, VS Code và LibreOffice, các mô hình Sonnet cho thấy cải thiện đều đặn trong 16 tháng:

Mô hìnhĐiểm OSWorld
Sonnet 3.5 (Th10 2024)Baseline
Sonnet 3.6+15%
Sonnet 4.5+40%
Sonnet 4.6+65%

Người dùng sớm báo cáo khả năng ngang tầm con người trong các tác vụ như điều hướng bảng tính phức tạp, điền biểu mẫu web nhiều bước và làm việc trên nhiều tab trình duyệt.

Khả Năng Chống Prompt Injection

Sử dụng máy tính tiềm ẩn rủi ro bảo mật từ các cuộc tấn công prompt injection trên website. Sonnet 4.6 cho thấy cải thiện lớn về khả năng chống injection so với Sonnet 4.5, đạt hiệu suất tương đương Opus 4.6 đắt tiền hơn.

Cửa Sổ Ngữ Cảnh 1M Token

Sonnet 4.6 có cửa sổ ngữ cảnh 1M token trong giai đoạn beta, đủ để xử lý toàn bộ codebase, tài liệu dài hoặc lịch sử hội thoại phong phú trong một yêu cầu duy nhất.

Claude Sonnet 4.6 Có Ý Nghĩa Gì Với Lập Trình Viên

Đối với lập trình viên, Sonnet 4.6 đại diện cho bước cải thiện đáng kể về hiệu quả chi phí. Các tác vụ trước đây cần mô hình Opus (giá $5/$25 mỗi triệu token) giờ hoạt động tương đương ở mức giá Sonnet. Điều này giúp phát triển phần mềm bằng AI trở nên dễ tiếp cận hơn cho:

  • Quy trình coding agentic: Các phiên coding tự động dài hơn và đáng tin cậy hơn
  • Đánh giá mã và gỡ lỗi: Phát hiện vấn đề trước khi đưa lên production
  • Tự động hóa sử dụng máy tính: Tự động hóa tương tác với phần mềm cũ
  • Phân tích codebase lớn: Sử dụng cửa sổ ngữ cảnh 1M để hiểu toàn bộ dự án

Câu hỏi thường gặp

Claude Sonnet 4.6 là gì?
Claude Sonnet 4.6 là mô hình Sonnet mạnh nhất của Anthropic, ra mắt tháng 2 năm 2026. Nó mang lại hiệu suất coding và suy luận trước đây chỉ có ở mô hình Opus, nhưng với giá Sonnet ($3/$15 mỗi triệu token). Hiện là mô hình mặc định trên claude.ai cho người dùng Free và Pro, bao gồm cửa sổ ngữ cảnh 1M token trong giai đoạn beta.
Claude Sonnet 4.6 có giá bao nhiêu?
Claude Sonnet 4.6 có giá $3 mỗi triệu token đầu vào và $15 mỗi triệu token đầu ra, tương đương Sonnet 4.5. Rẻ hơn 40% so với Opus ($5/$25). Có sẵn trên claude.ai, API Anthropic với model ID claude-sonnet-4-6, Amazon Bedrock và Google Cloud Vertex AI.
Claude Sonnet 4.6 có tốt hơn Opus 4.5 cho coding không?
Có. Các lập trình viên được dùng sớm thường ưa thích Sonnet 4.6 hơn Claude Opus 4.5 cho các tác vụ coding, dù Sonnet có giá rẻ hơn. Sonnet 4.6 đặc biệt mạnh trong sinh mã nguồn, tuân thủ chỉ dẫn và gỡ lỗi. Với các tác vụ đòi hỏi cao nhất, Claude Opus 4.6 vẫn dẫn đầu trên các benchmark như Terminal-Bench 2.0.
Sử dụng máy tính trong Claude Sonnet 4.6 là gì?
Sử dụng máy tính cho phép Claude tương tác với phần mềm như con người, nhấp nút, điền biểu mẫu và điều hướng giao diện. Trên OSWorld, benchmark tiêu chuẩn cho sử dụng máy tính, Sonnet 4.6 đạt điểm cao hơn 65% so với baseline gốc của Sonnet 3.5 từ tháng 10 năm 2024. Nó cũng có khả năng chống prompt injection tốt hơn đáng kể, tương đương với Opus 4.6 đắt tiền hơn.

Cập nhật tin tức

Nhận tin tức AI mới nhất qua email.

Chia sẻ