Claude Sonnet 4.6 : performance de frontière au tarif Sonnet

Nouveautés de Claude Sonnet 4.6

Claude Sonnet 4.6 est le modèle Sonnet le plus performant d'Anthropic, avec des améliorations majeures en code, utilisation d'ordinateur, raisonnement long contexte et planification agentique. Il est désormais le modèle par défaut sur claude.ai pour les utilisateurs Free et Pro.

Les développeurs ayant un accès anticipé préfèrent Sonnet 4.6 à son prédécesseur par une large marge, et souvent même à Claude Opus 4.5, le modèle le plus intelligent d'Anthropic de novembre 2025.

Performance en code de Claude Sonnet 4.6

Les performances qui nécessitaient auparavant un modèle de classe Opus sont désormais disponibles au tarif Sonnet (3 $/15 $ par million de tokens). Améliorations clés :

Meilleure génération de code : résultats plus cohérents et précis dans tous les langages
Meilleur suivi d'instructions : exécute plus précisément les instructions de codage complexes multi-étapes
Débogage renforcé : meilleur pour détecter ses propres erreurs et proposer des corrections
Performance sur tâches réelles : état de l'art sur les tâches bureautiques à forte valeur économique (GDPval-AA)

Pour les équipes utilisant l'analyse de sécurité par IA, Claude Code Security fonctionne avec Sonnet 4.6 et Opus 4.6 pour détecter les vulnérabilités dans les codebases.

Benchmarks d'utilisation d'ordinateur : résultats OSWorld

Anthropic a été pionnier de l'utilisation d'ordinateur généraliste en octobre 2024. Sur OSWorld, le benchmark standard où l'IA réalise des tâches sur des logiciels réels comme Chrome, VS Code et LibreOffice, les modèles Sonnet montrent une progression constante sur 16 mois :

Modèle	Score OSWorld
Sonnet 3.5 (oct. 2024)	Base
Sonnet 3.6	+15 %
Sonnet 4.5	+40 %
Sonnet 4.6	+65 %

Les premiers utilisateurs rapportent des capacités de niveau humain sur des tâches comme la navigation dans des tableurs complexes, le remplissage de formulaires web multi-étapes et le travail sur plusieurs onglets de navigateur.

Résistance aux injections de prompt

L'utilisation d'ordinateur présente des risques de sécurité liés aux attaques par injection de prompt sur les sites web. Sonnet 4.6 montre une amélioration majeure de la résistance aux injections par rapport à Sonnet 4.5, comparable à celle du plus coûteux Opus 4.6.

Fenêtre de contexte de 1M de tokens

Sonnet 4.6 dispose d'une fenêtre de contexte de 1M de tokens en bêta, suffisante pour traiter des codebases entières, de longs documents ou des historiques de conversation étendus en une seule requête.

Ce que Claude Sonnet 4.6 signifie pour les développeurs

Pour les développeurs, Sonnet 4.6 représente une amélioration significative du rapport coût-efficacité. Les tâches qui nécessitaient auparavant des modèles de classe Opus (à 5 $/25 $ par million de tokens) sont désormais comparables au tarif Sonnet. Cela rend le développement assisté par IA plus accessible pour :

Workflows de codage agentique : sessions de codage automatisé plus longues et plus fiables
Revue de code et débogage : détection des problèmes avant la mise en production
Automatisation de l'utilisation d'ordinateur : automatisation des interactions avec les logiciels existants
Analyse de grandes codebases : utilisation de la fenêtre de contexte de 1M pour comprendre des projets entiers

Questions Fréquentes

Qu'est-ce que Claude Sonnet 4.6 ?

Claude Sonnet 4.6 est le modèle Sonnet le plus performant d'Anthropic, publié en février 2026. Il offre des performances en code et raisonnement qui nécessitaient auparavant des modèles de classe Opus, mais au tarif Sonnet (3 $/15 $ par million de tokens). Il est désormais le modèle par défaut sur claude.ai pour les utilisateurs Free et Pro et inclut une fenêtre de contexte de 1M de tokens en bêta.

Combien coûte Claude Sonnet 4.6 ?

Claude Sonnet 4.6 coûte 3 $ par million de tokens en entrée et 15 $ par million de tokens en sortie, le même tarif que Sonnet 4.5. C'est 40 % moins cher que le tarif Opus (5 $/25 $). Il est disponible sur claude.ai, l'API Anthropic avec l'identifiant claude-sonnet-4-6, Amazon Bedrock et Google Cloud Vertex AI.

Claude Sonnet 4.6 est-il meilleur qu'Opus 4.5 pour le code ?

Oui. Les développeurs ayant un accès anticipé ont fréquemment préféré Sonnet 4.6 à Claude Opus 4.5 pour les tâches de code, bien que Sonnet soit un niveau de prix inférieur. Sonnet 4.6 excelle particulièrement en génération de code, suivi d'instructions et débogage. Pour les tâches les plus exigeantes, Claude Opus 4.6 reste en tête sur des benchmarks comme Terminal-Bench 2.0.

Qu'est-ce que l'utilisation d'ordinateur de Claude Sonnet 4.6 ?

L'utilisation d'ordinateur permet à Claude d'interagir avec les logiciels comme un humain, en cliquant sur des boutons, remplissant des formulaires et naviguant dans les interfaces. Sur OSWorld, le benchmark standard pour l'utilisation d'ordinateur, Sonnet 4.6 obtient un score 65 % supérieur à la base de Sonnet 3.5 d'octobre 2024. Il bénéficie également d'une résistance aux injections de prompt significativement améliorée, comparable à celle du plus coûteux Opus 4.6.