Code Velocity
AI 모델

Claude Sonnet 4.6: Sonnet 가격으로 프론티어급 코딩

·6 분 소요·Anthropic·원본 출처
공유
Claude Sonnet 4.6 OSWorld 벤치마크 진행 상황: Sonnet 3.5에서 4.6까지 65% 개선

Claude Sonnet 4.6의 새로운 점

Claude Sonnet 4.6는 Anthropic의 가장 강력한 Sonnet 모델로, 코딩, 컴퓨터 사용, 장문 컨텍스트 추론, 에이전트 계획에서 대폭 업그레이드되었습니다. 현재 claude.ai에서 Free 및 Pro 사용자의 기본 모델입니다.

얼리 액세스를 가진 개발자들은 전작보다 Sonnet 4.6를 큰 차이로 선호하며, Anthropic의 2025년 11월 최고 지능 모델인 Claude Opus 4.5보다도 종종 선호합니다.

Claude Sonnet 4.6 코딩 성능

이전에 Opus급 모델이 필요했던 성능이 이제 Sonnet 가격(백만 토큰당 $3/$15)으로 이용 가능합니다. 주요 개선 사항:

  • 향상된 코드 생성: 모든 언어에서 더 일관되고 정확한 코드 출력
  • 향상된 지시 사항 준수: 복잡한 다단계 코딩 지시를 더 정확하게 따름
  • 강화된 디버깅: 자체 오류를 발견하고 수정을 제안하는 능력 향상
  • 실제 작업 성능: 경제적으로 가치 있는 사무 작업(GDPval-AA)에서 최고 수준

AI 기반 보안 스캐닝을 사용하는 팀의 경우, Claude Code Security가 Sonnet 4.6와 Opus 4.6 모두에서 코드베이스의 취약점을 탐지합니다.

컴퓨터 사용 벤치마크: OSWorld 결과

Anthropic은 2024년 10월에 범용 컴퓨터 사용을 개척했습니다. AI가 Chrome, VS Code, LibreOffice 같은 실제 소프트웨어에서 작업을 완료하는 표준 벤치마크인 OSWorld에서 Sonnet 모델은 16개월간 꾸준한 개선을 보여왔습니다:

모델OSWorld 점수
Sonnet 3.5 (2024년 10월)기준선
Sonnet 3.6+15%
Sonnet 4.5+40%
Sonnet 4.6+65%

초기 사용자들은 복잡한 스프레드시트 탐색, 다단계 웹 폼 작성, 여러 브라우저 탭 간 작업 등에서 인간 수준의 능력을 보고합니다.

프롬프트 인젝션 저항력

컴퓨터 사용은 웹사이트의 프롬프트 인젝션 공격으로부터 보안 위험을 야기합니다. Sonnet 4.6는 Sonnet 4.5 대비 인젝션 저항력에서 크게 개선되어 더 비싼 Opus 4.6와 유사한 수준의 성능을 보입니다.

1M 토큰 컨텍스트 윈도우

Sonnet 4.6는 베타로 1M 토큰 컨텍스트 윈도우를 제공하며, 전체 코드베이스, 긴 문서, 또는 광범위한 대화 기록을 단일 요청으로 처리할 수 있습니다.

Claude Sonnet 4.6가 개발자에게 의미하는 것

개발자에게 Sonnet 4.6는 비용 효율성의 큰 향상을 의미합니다. 이전에 Opus급 모델(백만 토큰당 $5/$25)이 필요했던 작업이 이제 Sonnet 가격으로 비슷하게 수행됩니다. 이는 AI 기반 개발을 다음과 같은 분야에서 더 접근 가능하게 합니다:

  • 에이전틱 코딩 워크플로: 더 길고 안정적인 자동 코딩 세션
  • 코드 리뷰 및 디버깅: 프로덕션에 도달하기 전에 문제 발견
  • 컴퓨터 사용 자동화: 레거시 소프트웨어 상호작용 자동화
  • 대규모 코드베이스 분석: 1M 컨텍스트 윈도우로 전체 프로젝트 이해

자주 묻는 질문

Claude Sonnet 4.6란 무엇인가요?
Claude Sonnet 4.6는 2026년 2월에 출시된 Anthropic의 가장 강력한 Sonnet급 모델입니다. 이전에 Opus급 모델이 필요했던 코딩 및 추론 성능을 Sonnet 가격(백만 토큰당 $3/$15)으로 제공합니다. 현재 claude.ai에서 Free 및 Pro 사용자의 기본 모델이며 베타로 1M 토큰 컨텍스트 윈도우를 포함합니다.
Claude Sonnet 4.6의 비용은 얼마인가요?
Claude Sonnet 4.6는 입력 백만 토큰당 $3, 출력 백만 토큰당 $15로 Sonnet 4.5와 동일한 가격입니다. Opus 가격($5/$25)보다 40% 저렴합니다. claude.ai, 모델 ID claude-sonnet-4-6의 Anthropic API, Amazon Bedrock, Google Cloud Vertex AI에서 이용 가능합니다.
Claude Sonnet 4.6가 코딩에서 Opus 4.5보다 나은가요?
네. 얼리 액세스를 가진 개발자들이 Sonnet이 더 저렴한 등급임에도 불구하고 코딩 작업에서 Claude Opus 4.5보다 Sonnet 4.6를 자주 선호했습니다. Sonnet 4.6는 코드 생성, 지시 사항 준수, 디버깅에서 특히 강점을 보입니다. 가장 까다로운 작업의 경우 Claude Opus 4.6가 Terminal-Bench 2.0 같은 벤치마크에서 여전히 선두를 달립니다.
Claude Sonnet 4.6의 컴퓨터 사용이란 무엇인가요?
컴퓨터 사용은 Claude가 버튼 클릭, 폼 작성, UI 탐색 등 사람처럼 소프트웨어와 상호작용할 수 있게 합니다. 컴퓨터 사용 표준 벤치마크인 OSWorld에서 Sonnet 4.6는 2024년 10월 Sonnet 3.5 기준보다 65% 높은 점수를 기록합니다. 또한 프롬프트 인젝션 저항력이 크게 향상되어 더 비싼 Opus 4.6와 유사한 수준의 성능을 보입니다.

최신 소식 받기

최신 AI 뉴스를 이메일로 받아보세요.

공유