콘텐츠로 이동

Claude 3.5 Sonnet

개요

  • 개발사: Anthropic
  • 출시일: 2024년 6월 20일 (초기), 2024년 10월 22일 (업그레이드)
  • 모델 계열: Claude 3.5
  • Constitutional AI: Anthropic의 Constitutional AI 방법론 적용. ASL-2 (AI Safety Level 2) 유지. 영국 AISI 및 미국 AISI의 사전 배포 안전성 평가 완료.

사양

항목 내용
Context Window 200,000 tokens
최대 출력 토큰 8,192 tokens
모델 유형 Standard (비추론 모델)
비전 지원 지원 (최고 수준의 비전 모델)
Computer Use 지원 (베타)

가격

타입 가격 (per 1M tokens)
Input $3.00
Output $15.00
Prompt Caching Write $3.75
Prompt Caching Read $0.30

주요 특징

  • Claude 3 Opus를 능가하는 성능을 Claude 3 Sonnet의 가격과 속도로 제공
  • SWE-bench Verified 49.0% 달성 (업그레이드 버전)
  • TAU-bench: 소매 도메인 69.2%, 항공 도메인 46.0%
  • Computer Use 기능 최초 공개 (베타)
  • Claude 3 Opus 대비 2배 빠른 속도
  • 업계 최고 수준의 비전 능력

장점

  • 뛰어난 가격 대비 성능 (Opus급 성능을 Sonnet 가격에)
  • 복잡한 지시사항, 뉘앙스, 유머 이해 능력
  • 고품질 콘텐츠 작성 (자연스럽고 공감 가능한 톤)
  • 불완전한 이미지에서도 텍스트 전사 가능
  • 코드 번역 및 레거시 코드 마이그레이션 능력
  • Artifacts 기능으로 동적 협업 환경 제공

단점/한계

  • Claude 4 모델 대비 코딩 성능 낮음
  • Extended Thinking 미지원
  • Computer Use 기능은 아직 실험적이며 오류 발생 가능
  • 병렬 도구 실행 미지원

적합한 사용 사례

  • 컨텍스트 기반 고객 지원
  • 멀티스텝 워크플로우 오케스트레이션
  • 코드 생성 및 트러블슈팅
  • 레거시 애플리케이션 업데이트 및 코드베이스 마이그레이션
  • 차트, 그래프 해석이 필요한 비전 작업
  • 소매, 물류, 금융 서비스의 이미지 분석

벤치마크 성능

벤치마크 점수
SWE-bench Verified 49.0% (업그레이드 버전)
TAU-bench (소매) 69.2%
TAU-bench (항공) 46.0%
OSWorld (스크린샷) 14.9%

버전 히스토리

  • 2024년 6월: 초기 버전 출시 (SWE-bench 33.4%)
  • 2024년 10월: 업그레이드 버전 출시 (SWE-bench 49.0%, Computer Use 베타)

참고 자료