Claude Opus 4.6은 2026년 2월에 출시된 Anthropic의 최고 지능 모델로, 단일 프롬프트가 아닌 전체 워크플로를 아우르는 에이전트에 맞게 설계되었습니다. 100만 토큰 컨텍스트 창, 최대 128K 출력 토큰, 여러 하위 에이전트를 병렬로 생성·조율하는 에이전트 팀 기능을 갖추고 있습니다. 추론 깊이를 동적으로 조절하는 적응형 사고로 대규모 코드베이스, 복잡한 리팩토링, 장기 지식 작업, 종단간 프로젝트 수행에 뛰어나며, 한 번의 생성으로 거의 완성된 수준의 문서와 분석을 작성합니다.
Anthropic ProAnthropic Max (5x)Anthropic Max (20x)API|비전심층 사고웹 검색|상용 모델
AI 성능 평가
Arena 종합 점수
1502
±5집계일 2026-04-20
종합 순위
🥈 2위
18,888 투표수
Arena 능력별 점수
한국어 능력
1416±3219위
복잡한 질문
1535±7🥇 1위
전문 지식
1541±174위
지시 이행
1515±9🥇 1위
대화 기억
1512±11🥉 3위
창의력
1494±12🥈 2위
코딩 실력
1554±10🥉 3위
수학 능력
1515±17🥈 2위
Arena 직군별 점수
문학·창작
1494±10🥈 2위
생활·사회과학
1517±11🥈 2위
엔터·미디어
1487±11🥇 1위
경영·금융
1499±10🥉 3위
의학·보건
1512±176위
법률·행정
1517±17🥈 2위
소프트웨어·IT
1543±8🥈 2위
수학·통계
1517±20🥈 2위
종합
AA Intelligence Index
53%↑15%
LiveBench
77%↑17%
ForecastBench
59%↑0%
추론·수학
GPQA Diamond
90%↑9%
HLE
37%↑20%
LB 추론
89%↑29%
LB 수학
89%↑16%
LB 데이터 분석
70%↑20%
코딩
AA Coding Index
48%↑14%
LB 코딩
78%↑5%
LB 에이전틱
62%↑18%
TAU2
92%↑19%
TerminalBench
46%↑15%
SciCode
52%↑11%
언어·지시
IFBench
53%↓4%
AA-LCR
71%↑9%
환각률 (HHEM)
12%↑2%
사실 일관성 (HHEM)
88%↓2%
LB 언어
83%↑11%
LB 지시
63%↑17%
출력 속도
일반 모드
45tok/s↓37
출력 시작 1.75s
추론 모드
56tok/s↓32
출력 시작 11.70s