Code Velocity
AI Модели

Claude Sonnet 4.6: Водещо Програмиране на Цена Sonnet

·6 мин четене·Anthropic·Оригинален източник
Сподели
Прогрес на бенчмарка OSWorld за Claude Sonnet 4.6, показващ 65% подобрение от Sonnet 3.5 до 4.6

Какво Е Новото в Claude Sonnet 4.6

Claude Sonnet 4.6 е най-мощният модел Sonnet на Anthropic с големи подобрения в програмирането, използването на компютър, разсъжденията в дълъг контекст и планирането на агенти. Сега е моделът по подразбиране в claude.ai за потребители Free и Pro.

Разработчиците с ранен достъп предпочитат Sonnet 4.6 пред предшественика му с голяма разлика, а често дори пред Claude Opus 4.5, най-интелигентния модел на Anthropic от ноември 2025 г.

Производителност в Програмирането на Claude Sonnet 4.6

Производителност, която преди изискваше модел от клас Opus, вече е достъпна на цена Sonnet ($3/$15 на милион токена). Основни подобрения:

  • По-добро генериране на код: По-последователен и точен изход на код на различни езици
  • По-добро следване на инструкции: По-прецизно изпълнение на сложни многостъпкови инструкции
  • По-силно дебъгване: По-добро откриване на собствени грешки и предлагане на поправки
  • Реални задачи: Най-високо ниво в икономически ценни офис задачи (GDPval-AA)

За екипи, използващи AI сканиране за сигурност, Claude Code Security работи със Sonnet 4.6 и Opus 4.6 за откриване на уязвимости в кодови бази.

Бенчмаркове за Използване на Компютър: Резултати от OSWorld

Anthropic е пионер в използването на компютър с общо предназначение от октомври 2024 г. На OSWorld, стандартния бенчмарк, където AI изпълнява задачи в реален софтуер като Chrome, VS Code и LibreOffice, моделите Sonnet показват постоянно подобрение в продължение на 16 месеца:

МоделРезултат OSWorld
Sonnet 3.5 (Окт 2024)Baseline
Sonnet 3.6+15%
Sonnet 4.5+40%
Sonnet 4.6+65%

Ранните потребители съобщават за способности на човешко ниво при задачи като навигация в сложни таблици, попълване на многостъпкови уеб формуляри и работа с множество раздели на браузъра.

Защита от Prompt Injection

Използването на компютър крие рискове за сигурността от атаки чрез prompt injection на уебсайтове. Sonnet 4.6 показва голямо подобрение в устойчивостта на инжектиране в сравнение със Sonnet 4.5, на нивото на по-скъпия Opus 4.6.

Контекстен Прозорец от 1M Токена

Sonnet 4.6 разполага с контекстен прозорец от 1M токена в бета — достатъчно за обработка на цели кодови бази, дълги документи или обширни истории на разговори в една заявка.

Какво Означава Claude Sonnet 4.6 за Разработчиците

За разработчиците Sonnet 4.6 представлява значително подобрение на ефективността на разходите. Задачи, които преди изискваха модели Opus (на $5/$25 на милион токена), сега работят сравнимо на цена Sonnet. Това прави разработката с AI по-достъпна за:

  • Агентни работни процеси: По-дълги и по-надеждни автоматизирани сесии за програмиране
  • Преглед на код и дебъгване: Откриване на проблеми преди достигане до продукция
  • Автоматизация на използване на компютър: Автоматизиране на взаимодействия с наследен софтуер
  • Анализ на големи кодови бази: Използване на прозореца от 1M за разбиране на цели проекти

Оригинален източник

https://www.anthropic.com/news/claude-sonnet-4-6

Често задавани въпроси

Какво е Claude Sonnet 4.6?
Claude Sonnet 4.6 е най-мощният модел от ниво Sonnet на Anthropic, пуснат през февруари 2026 г. Той осигурява производителност в програмиране и разсъждение, която преди изискваше модели от клас Opus, но на цена Sonnet ($3/$15 на милион токена). Сега е моделът по подразбиране в claude.ai за потребители Free и Pro и включва контекстен прозорец от 1M токена в бета.
Колко струва Claude Sonnet 4.6?
Claude Sonnet 4.6 струва $3 на милион входни токена и $15 на милион изходни токена, същото като Sonnet 4.5. Това е с 40% по-евтино от Opus ($5/$25). Достъпен е в claude.ai, чрез API на Anthropic с model ID claude-sonnet-4-6, Amazon Bedrock и Google Cloud Vertex AI.
По-добър ли е Claude Sonnet 4.6 от Opus 4.5 за програмиране?
Да. Разработчици с ранен достъп често предпочитат Sonnet 4.6 пред Claude Opus 4.5 за задачи по програмиране, въпреки че Sonnet е по-евтин клас. Sonnet 4.6 показва особена сила в генерирането на код, следването на инструкции и дебъгването. За най-взискателните задачи Claude Opus 4.6 все още води в бенчмаркове като Terminal-Bench 2.0.
Какво е използването на компютър в Claude Sonnet 4.6?
Използването на компютър позволява на Claude да взаимодейства със софтуер като човек — кликане на бутони, попълване на формуляри и навигация в интерфейси. На OSWorld, стандартния бенчмарк за използване на компютър, Sonnet 4.6 постига с 65% по-висок резултат от оригиналния Sonnet 3.5 от октомври 2024 г. Освен това има значително по-добра защита от prompt injection, подобно на по-скъпия Opus 4.6.

Бъдете информирани

Получавайте последните AI новини по имейл.

Сподели