Claude
Claude

Claude Sonnet 4

Model ID:claude-sonnet-4-20250514
2025-05-22상용 모델
API
종합18위
인기94위

Claude Sonnet 4는 이전 모델인 Sonnet 3.7의 기능을 대폭 강화하여, 코딩과 추론 작업에서 더욱 정밀하고 제어 가능한 성능을 보여줍니다. SWE-bench에서 72.7%라는 최고 수준의 성능을 달성한 Sonnet 4는 뛰어난 역량과 연산 효율성 사이의 균형을 갖추어, 일상적인 코딩부터 복잡한 소프트웨어 개발 프로젝트까지 폭넓게 활용할 수 있습니다. 주요 개선 사항으로는 자율적인 코드베이스 탐색 기능 향상, 에이전트 기반 워크플로우에서의 오류율 감소, 그리고 복잡한 지시 사항을 따르는 신뢰성 강화가 있습니다. Sonnet 4는 실용적인 일상 업무에 최적화되어 있으며, 다양한 내외부 환경에서 효율성과 반응성을 유지하면서도 고도의 추론 능력을 제공합니다. 자세한 내용은 [블로그 게시물](https://www.anthropic.com/news/claude-4)에서 확인하실 수 있습니다.

학습 완료일
2025-01-31

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량
200KIN64KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)
$3IN$15OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

AI 성능 평가

Arena 종합 점수
1399
±4
집계일 2026-04-02
종합 순위
94위
35,417 투표수
Arena 능력별 점수
한국어 능력
1335±2388위
복잡한 질문
1431±675위
전문 지식
1435±1466위
지시 이행
1414±758위
대화 기억
1419±866위
창의력
1395±959위
코딩 실력
1473±850위
수학 능력
1402±1388위
Arena 직군별 점수
문학·창작
1397±768위
생활·사회과학
1418±887위
엔터·미디어
1388±866위
경영·금융
1385±8107위
의학·보건
1420±1395위
법률·행정
1409±1387위
소프트웨어·IT
1443±677위
수학·통계
1409±1391위
추론 능력
AA Intelligence Index
39%↑0%
MMLU-Pro
84%↑2%
GPQA Diamond
78%↓4%
HLE
9.6%↓7%
수학
AA Math Index
74%↑0%
MATH-500
99%↑5%
AIME 2024
77%↑18%
AIME 2025
74%↑0%
코딩 실력
AA Coding Index
34%↓2%
LiveCodeBench
66%↑0%
SciCode
40%↓2%
TerminalBench
31%↓3%
지시 이행
IFBench
55%↓3%
환각률 (HHEM)
10%↑0%
사실 일관성 (HHEM)
90%↑0%
장문 이해
AA-LCR
65%↑1%
에이전틱 AI 능력
TAU2
65%↓7%
속도
일반 모드
45tok/sec↓33
출력 시작 0.80s
Artificial Analysis
추론 모드
46tok/sec↓27
출력 시작 8.30s
Artificial Analysis