Code Velocity
KI-Modelle

Claude Sonnet 4.6: Frontier-Coding zum Sonnet-Preis

·6 Min. Lesezeit·Anthropic·Originalquelle
Teilen
Claude Sonnet 4.6 OSWorld Benchmark-Fortschritt zeigt 65% Verbesserung von Sonnet 3.5 zu 4.6

Was ist neu in Claude Sonnet 4.6

Claude Sonnet 4.6 ist Anthropics leistungsfähigstes Sonnet-Modell mit umfassenden Upgrades bei Coding, Computer Use, Langkontext-Reasoning und Agent-Planung. Es ist jetzt das Standardmodell auf claude.ai für Free- und Pro-Nutzer.

Entwickler mit Early Access bevorzugen Sonnet 4.6 mit großem Abstand gegenüber seinem Vorgänger — und oft sogar gegenüber Claude Opus 4.5, Anthropics smartestem Modell vom November 2025.

Claude Sonnet 4.6 Coding-Leistung

Leistung, die zuvor ein Opus-Klasse-Modell erforderte, ist jetzt zum Sonnet-Preis ($3/$15 pro Million Tokens) verfügbar. Wichtige Verbesserungen:

  • Bessere Codegenerierung: Konsistentere, genauere Code-Ausgabe über Sprachen hinweg
  • Verbesserte Instruktionsbefolgung: Folgt komplexen mehrstufigen Coding-Anweisungen präziser
  • Stärkeres Debugging: Besser darin, eigene Fehler zu erkennen und Korrekturen vorzuschlagen
  • Leistung bei realen Aufgaben: State-of-the-Art bei wirtschaftlich wertvollen Büroaufgaben (GDPval-AA)

Für Teams, die KI-gestütztes Security-Scanning nutzen, arbeitet Claude Code Security sowohl mit Sonnet 4.6 als auch Opus 4.6, um Schwachstellen in Codebases zu erkennen.

Computer Use Benchmarks: OSWorld-Ergebnisse

Anthropic war im Oktober 2024 Pionier der universellen Computer Use. Auf OSWorld, dem Standard-Benchmark, bei dem KI Aufgaben in realer Software wie Chrome, VS Code und LibreOffice erledigt, zeigen Sonnet-Modelle über 16 Monate stetige Verbesserungen:

ModellOSWorld-Score
Sonnet 3.5 (Okt 2024)Baseline
Sonnet 3.6+15%
Sonnet 4.5+40%
Sonnet 4.6+65%

Frühe Nutzer berichten von menschenähnlicher Fähigkeit bei Aufgaben wie der Navigation komplexer Tabellenkalkulationen, dem Ausfüllen mehrstufiger Web-Formulare und dem Arbeiten über mehrere Browser-Tabs hinweg.

Prompt-Injection-Schutz

Computer Use birgt Sicherheitsrisiken durch Prompt-Injection-Angriffe auf Websites. Sonnet 4.6 zeigt eine deutliche Verbesserung beim Injektionsschutz gegenüber Sonnet 4.5 und performt ähnlich wie das teurere Opus 4.6.

1M Token Kontextfenster

Sonnet 4.6 bietet ein 1M Token Kontextfenster in der Beta — genug, um ganze Codebases, lange Dokumente oder umfangreiche Gesprächsverläufe in einer einzigen Anfrage zu verarbeiten.

Was Claude Sonnet 4.6 für Entwickler bedeutet

Für Entwickler stellt Sonnet 4.6 eine signifikante Verbesserung der Kosteneffizienz dar. Aufgaben, die zuvor Opus-Klasse-Modelle ($5/$25 pro Million Tokens) erforderten, performan jetzt vergleichbar zum Sonnet-Preis. Das macht KI-gestützte Entwicklung zugänglicher für:

  • Agentische Coding-Workflows: Längere, zuverlässigere automatisierte Coding-Sessions
  • Code-Review und Debugging: Probleme erkennen, bevor sie in die Produktion gelangen
  • Computer-Use-Automatisierung: Interaktionen mit Legacy-Software automatisieren
  • Analyse großer Codebases: Das 1M Kontextfenster nutzen, um gesamte Projekte zu verstehen

Häufig gestellte Fragen

Was ist Claude Sonnet 4.6?
Claude Sonnet 4.6 ist Anthropics leistungsfähigstes Sonnet-Modell, veröffentlicht im Februar 2026. Es liefert Coding- und Reasoning-Leistung, die zuvor Opus-Klasse-Modelle erforderte, aber zum Sonnet-Preis ($3/$15 pro Million Tokens). Es ist jetzt das Standardmodell auf claude.ai für Free- und Pro-Nutzer und bietet ein 1M Token Kontextfenster in der Beta.
Was kostet Claude Sonnet 4.6?
Claude Sonnet 4.6 kostet $3 pro Million Eingabe-Tokens und $15 pro Million Ausgabe-Tokens, wie Sonnet 4.5. Das ist 40% günstiger als der Opus-Preis ($5/$25). Es ist verfügbar auf claude.ai, der Anthropic API mit Model ID claude-sonnet-4-6, Amazon Bedrock und Google Cloud Vertex AI.
Ist Claude Sonnet 4.6 besser als Opus 4.5 beim Coding?
Ja. Entwickler mit Early Access bevorzugten Sonnet 4.6 häufig gegenüber Claude Opus 4.5 für Coding-Aufgaben, obwohl Sonnet die günstigere Stufe ist. Sonnet 4.6 zeigt besondere Stärke bei Codegenerierung, Instruktionsbefolgung und Debugging. Für die anspruchsvollsten Aufgaben führt Claude Opus 4.6 weiterhin bei Benchmarks wie Terminal-Bench 2.0.
Was ist Computer Use bei Claude Sonnet 4.6?
Computer Use ermöglicht es Claude, Software wie ein Mensch zu bedienen — Buttons klicken, Formulare ausfüllen und durch Benutzeroberflächen navigieren. Auf OSWorld, dem Standard-Benchmark für Computer Use, erzielt Sonnet 4.6 eine um 65% höhere Punktzahl als die ursprüngliche Sonnet 3.5 Baseline von Oktober 2024. Es hat außerdem eine deutlich verbesserte Prompt-Injection-Resistenz und performt ähnlich wie das teurere Opus 4.6.

Bleiben Sie informiert

Erhalten Sie die neuesten KI-Nachrichten per E-Mail.

Teilen