Qué Hay de Nuevo en Claude Sonnet 4.6
Claude Sonnet 4.6 es el modelo Sonnet más capaz de Anthropic, con mejoras importantes en codificación, computer use, razonamiento de contexto largo y planificación de agentes. Es ahora el modelo predeterminado en claude.ai para usuarios Free y Pro.
Los desarrolladores con acceso anticipado prefieren Sonnet 4.6 sobre su predecesor por un amplio margen, y frecuentemente incluso sobre Claude Opus 4.5, el modelo más inteligente de Anthropic de noviembre 2025.
Rendimiento de Codificación de Claude Sonnet 4.6
El rendimiento que anteriormente requería un modelo de clase Opus ahora está disponible a precio Sonnet ($3/$15 por millón de tokens). Mejoras clave:
- Mejor generación de código: Salida de código más consistente y precisa en todos los lenguajes
- Mejor seguimiento de instrucciones: Sigue instrucciones de codificación complejas de múltiples pasos con más precisión
- Depuración más fuerte: Mejor detección de sus propios errores y sugerencia de correcciones
- Rendimiento en tareas reales: Estado del arte en tareas de oficina económicamente valiosas (GDPval-AA)
Para equipos que usan escaneo de seguridad con IA, Claude Code Security funciona tanto con Sonnet 4.6 como con Opus 4.6 para detectar vulnerabilidades en bases de código.
Benchmarks de Computer Use: Resultados OSWorld
Anthropic fue pionero en el computer use de propósito general en octubre de 2024. En OSWorld, el benchmark estándar donde la IA completa tareas en software real como Chrome, VS Code y LibreOffice, los modelos Sonnet han mostrado una mejora constante a lo largo de 16 meses:
| Modelo | Puntuación OSWorld |
|---|---|
| Sonnet 3.5 (Oct 2024) | Línea base |
| Sonnet 3.6 | +15% |
| Sonnet 4.5 | +40% |
| Sonnet 4.6 | +65% |
Los usuarios tempranos reportan capacidad a nivel humano en tareas como navegar hojas de cálculo complejas, llenar formularios web de múltiples pasos y trabajar con múltiples pestañas del navegador.
Resistencia a Inyección de Prompts
El computer use presenta riesgos de seguridad por ataques de inyección de prompts en sitios web. Sonnet 4.6 muestra una mejora importante en resistencia a inyecciones comparado con Sonnet 4.5, con un rendimiento similar al más costoso Opus 4.6.
Ventana de Contexto de 1M Tokens
Sonnet 4.6 cuenta con una ventana de contexto de 1M tokens en beta, suficiente para procesar bases de código completas, documentos largos o historiales de conversación extensos en una sola solicitud.
Qué Significa Claude Sonnet 4.6 para los Desarrolladores
Para los desarrolladores, Sonnet 4.6 representa una mejora significativa en relación costo-eficiencia. Tareas que anteriormente necesitaban modelos de clase Opus (a $5/$25 por millón de tokens) ahora rinden de manera comparable a precio Sonnet. Esto hace que el desarrollo impulsado por IA sea más accesible para:
- Flujos de trabajo de codificación agéntica: Sesiones de codificación automatizadas más largas y fiables
- Revisión de código y depuración: Detectar problemas antes de que lleguen a producción
- Automatización de computer use: Automatizar interacciones con software heredado
- Análisis de bases de código grandes: Usar la ventana de contexto de 1M para comprender proyectos completos
Fuente original
https://www.anthropic.com/news/claude-sonnet-4-6Preguntas Frecuentes
¿Qué es Claude Sonnet 4.6?
¿Cuánto cuesta Claude Sonnet 4.6?
¿Es Claude Sonnet 4.6 mejor que Opus 4.5 para programar?
¿Qué es el computer use de Claude Sonnet 4.6?
Mantente Actualizado
Recibe las últimas noticias de IA en tu correo.
