Code Velocity
مدل‌های هوش مصنوعی

Claude Sonnet 4.6: کدنویسی مرزی با قیمت Sonnet

·6 دقیقه مطالعه·Anthropic·منبع اصلی
اشتراک‌گذاری
پیشرفت بنچمارک OSWorld Claude Sonnet 4.6 با نمایش ۶۵٪ بهبود از Sonnet 3.5 تا 4.6

چه چیز جدیدی در Claude Sonnet 4.6 هست

Claude Sonnet 4.6 توانمندترین مدل Sonnet شرکت Anthropic است با ارتقاهای عمده در کدنویسی، computer use، استدلال زمینه بلند و برنامه‌ریزی عامل. اکنون مدل پیش‌فرض در claude.ai برای کاربران Free و Pro است.

توسعه‌دهندگانی با دسترسی زودهنگام Sonnet 4.6 را با فاصله زیادی نسبت به نسل قبلی ترجیح می‌دهند و اغلب حتی بر Claude Opus 4.5، هوشمندترین مدل Anthropic از نوامبر ۲۰۲۵.

عملکرد کدنویسی Claude Sonnet 4.6

عملکردی که قبلاً نیاز به مدل کلاس Opus داشت اکنون با قیمت Sonnet ($3/$15 به‌ازای هر میلیون توکن) در دسترس است. بهبودهای کلیدی:

  • تولید کد بهتر: خروجی کد دقیق‌تر و سازگارتر در زبان‌های مختلف
  • پیروی بهتر از دستورالعمل‌ها: دستورالعمل‌های کدنویسی چندمرحله‌ای پیچیده را دقیق‌تر دنبال می‌کند
  • اشکال‌زدایی قوی‌تر: بهتر در گرفتن اشتباهات خود و پیشنهاد اصلاحات
  • عملکرد در وظایف واقعی: پیشرفته‌ترین در وظایف اداری ارزشمند اقتصادی (GDPval-AA)

برای تیم‌هایی که از اسکن امنیتی مبتنی بر هوش مصنوعی استفاده می‌کنند، Claude Code Security با هر دو Sonnet 4.6 و Opus 4.6 برای شناسایی آسیب‌پذیری‌ها در پایگاه‌های کد کار می‌کند.

بنچمارک‌های Computer Use: نتایج OSWorld

Anthropic در اکتبر ۲۰۲۴ پیشگام computer use همه‌منظوره بود. در OSWorld، بنچمارک استانداردی که در آن هوش مصنوعی وظایف را در نرم‌افزارهای واقعی مانند Chrome، VS Code و LibreOffice انجام می‌دهد، مدل‌های Sonnet در ۱۶ ماه بهبود مداوم نشان داده‌اند:

مدلامتیاز OSWorld
Sonnet 3.5 (اکتبر ۲۰۲۴)خط پایه
Sonnet 3.6+۱۵٪
Sonnet 4.5+۴۰٪
Sonnet 4.6+۶۵٪

کاربران اولیه از توانایی سطح انسانی در وظایفی مانند ناوبری صفحات گسترده پیچیده، پر کردن فرم‌های وب چندمرحله‌ای و کار در چندین تب مرورگر گزارش می‌دهند.

مقاومت در برابر تزریق پرامپت

Computer use خطرات امنیتی ناشی از حملات تزریق پرامپت در وب‌سایت‌ها را به همراه دارد. Sonnet 4.6 بهبود عمده‌ای در مقاومت در برابر تزریق نسبت به Sonnet 4.5 نشان می‌دهد و عملکردی مشابه Opus 4.6 گران‌تر دارد.

پنجره زمینه 1M توکن

Sonnet 4.6 پنجره زمینه 1M توکن در نسخه بتا دارد — کافی برای پردازش کل پایگاه‌های کد، اسناد بلند یا تاریخچه‌های گفتگوی گسترده در یک درخواست واحد.

Claude Sonnet 4.6 برای توسعه‌دهندگان چه معنایی دارد

برای توسعه‌دهندگان، Sonnet 4.6 بهبود قابل‌توجهی در بهره‌وری هزینه را نشان می‌دهد. وظایفی که قبلاً نیاز به مدل‌های کلاس Opus (با $5/$25 به‌ازای هر میلیون توکن) داشتند اکنون با قیمت Sonnet عملکرد مشابهی دارند. این توسعه مبتنی بر هوش مصنوعی را برای موارد زیر دسترس‌تر می‌سازد:

  • گردش‌های کاری کدنویسی عاملی: جلسات کدنویسی خودکار طولانی‌تر و قابل‌اعتمادتر
  • بازبینی کد و اشکال‌زدایی: شناسایی مشکلات قبل از رسیدن به تولید
  • اتوماسیون computer use: خودکارسازی تعاملات نرم‌افزار قدیمی
  • تحلیل پایگاه‌های کد بزرگ: استفاده از پنجره زمینه 1M برای درک کل پروژه‌ها

سوالات متداول

Claude Sonnet 4.6 چیست؟
Claude Sonnet 4.6 توانمندترین مدل سطح Sonnet شرکت Anthropic است که در فوریه ۲۰۲۶ منتشر شد. عملکرد کدنویسی و استدلالی ارائه می‌دهد که قبلاً نیاز به مدل‌های کلاس Opus داشت، اما با قیمت Sonnet ($3/$15 به‌ازای هر میلیون توکن). اکنون مدل پیش‌فرض در claude.ai برای کاربران Free و Pro است و پنجره زمینه 1M توکن در نسخه بتا دارد.
هزینه Claude Sonnet 4.6 چقدر است؟
Claude Sonnet 4.6 هزینه‌ای معادل ۳ دلار به‌ازای هر میلیون توکن ورودی و ۱۵ دلار به‌ازای هر میلیون توکن خروجی دارد، مانند Sonnet 4.5. این ۴۰٪ ارزان‌تر از قیمت Opus ($5/$25) است. در claude.ai، API Anthropic با شناسه مدل claude-sonnet-4-6، Amazon Bedrock و Google Cloud Vertex AI در دسترس است.
آیا Claude Sonnet 4.6 برای کدنویسی بهتر از Opus 4.5 است؟
بله. توسعه‌دهندگانی که دسترسی زودهنگام داشتند اغلب Sonnet 4.6 را بر Claude Opus 4.5 برای وظایف کدنویسی ترجیح دادند، با وجود اینکه Sonnet سطح ارزان‌تر است. Sonnet 4.6 قدرت خاصی در تولید کد، پیروی از دستورالعمل‌ها و اشکال‌زدایی نشان می‌دهد. برای سخت‌ترین وظایف، Claude Opus 4.6 همچنان در بنچمارک‌هایی مانند Terminal-Bench 2.0 پیشتاز است.
computer use در Claude Sonnet 4.6 چیست؟
computer use به Claude اجازه می‌دهد مانند انسان با نرم‌افزار تعامل داشته باشد — کلیک روی دکمه‌ها، پر کردن فرم‌ها و ناوبری در رابط‌های کاربری. در OSWorld، بنچمارک استاندارد computer use، Sonnet 4.6 امتیازی ۶۵٪ بالاتر از خط پایه اصلی Sonnet 3.5 از اکتبر ۲۰۲۴ کسب می‌کند. همچنین مقاومت در برابر تزریق پرامپت به‌طور قابل‌توجهی بهبود یافته و عملکردی مشابه Opus 4.6 گران‌تر دارد.

به‌روز بمانید

آخرین اخبار هوش مصنوعی را در ایمیل خود دریافت کنید.

اشتراک‌گذاری