Nouveautés de Claude Sonnet 4.6
Claude Sonnet 4.6 est le modèle Sonnet le plus performant d'Anthropic, avec des améliorations majeures en code, utilisation d'ordinateur, raisonnement long contexte et planification agentique. Il est désormais le modèle par défaut sur claude.ai pour les utilisateurs Free et Pro.
Les développeurs ayant un accès anticipé préfèrent Sonnet 4.6 à son prédécesseur par une large marge, et souvent même à Claude Opus 4.5, le modèle le plus intelligent d'Anthropic de novembre 2025.
Performance en code de Claude Sonnet 4.6
Les performances qui nécessitaient auparavant un modèle de classe Opus sont désormais disponibles au tarif Sonnet (3 $/15 $ par million de tokens). Améliorations clés :
- Meilleure génération de code : résultats plus cohérents et précis dans tous les langages
- Meilleur suivi d'instructions : exécute plus précisément les instructions de codage complexes multi-étapes
- Débogage renforcé : meilleur pour détecter ses propres erreurs et proposer des corrections
- Performance sur tâches réelles : état de l'art sur les tâches bureautiques à forte valeur économique (GDPval-AA)
Pour les équipes utilisant l'analyse de sécurité par IA, Claude Code Security fonctionne avec Sonnet 4.6 et Opus 4.6 pour détecter les vulnérabilités dans les codebases.
Benchmarks d'utilisation d'ordinateur : résultats OSWorld
Anthropic a été pionnier de l'utilisation d'ordinateur généraliste en octobre 2024. Sur OSWorld, le benchmark standard où l'IA réalise des tâches sur des logiciels réels comme Chrome, VS Code et LibreOffice, les modèles Sonnet montrent une progression constante sur 16 mois :
| Modèle | Score OSWorld |
|---|---|
| Sonnet 3.5 (oct. 2024) | Base |
| Sonnet 3.6 | +15 % |
| Sonnet 4.5 | +40 % |
| Sonnet 4.6 | +65 % |
Les premiers utilisateurs rapportent des capacités de niveau humain sur des tâches comme la navigation dans des tableurs complexes, le remplissage de formulaires web multi-étapes et le travail sur plusieurs onglets de navigateur.
Résistance aux injections de prompt
L'utilisation d'ordinateur présente des risques de sécurité liés aux attaques par injection de prompt sur les sites web. Sonnet 4.6 montre une amélioration majeure de la résistance aux injections par rapport à Sonnet 4.5, comparable à celle du plus coûteux Opus 4.6.
Fenêtre de contexte de 1M de tokens
Sonnet 4.6 dispose d'une fenêtre de contexte de 1M de tokens en bêta, suffisante pour traiter des codebases entières, de longs documents ou des historiques de conversation étendus en une seule requête.
Ce que Claude Sonnet 4.6 signifie pour les développeurs
Pour les développeurs, Sonnet 4.6 représente une amélioration significative du rapport coût-efficacité. Les tâches qui nécessitaient auparavant des modèles de classe Opus (à 5 $/25 $ par million de tokens) sont désormais comparables au tarif Sonnet. Cela rend le développement assisté par IA plus accessible pour :
- Workflows de codage agentique : sessions de codage automatisé plus longues et plus fiables
- Revue de code et débogage : détection des problèmes avant la mise en production
- Automatisation de l'utilisation d'ordinateur : automatisation des interactions avec les logiciels existants
- Analyse de grandes codebases : utilisation de la fenêtre de contexte de 1M pour comprendre des projets entiers
Source originale
https://www.anthropic.com/news/claude-sonnet-4-6Questions Fréquentes
Qu'est-ce que Claude Sonnet 4.6 ?
Combien coûte Claude Sonnet 4.6 ?
Claude Sonnet 4.6 est-il meilleur qu'Opus 4.5 pour le code ?
Qu'est-ce que l'utilisation d'ordinateur de Claude Sonnet 4.6 ?
Restez informé
Recevez les dernières actualités IA dans votre boîte mail.
