Anthropic
Anthropic

Claude Opus 4.5

2025-11-24

Claude Opus 4.5는 2025년 11월에 출시된 Anthropic의 프론티어 추론 모델로, 복잡한 소프트웨어 엔지니어링, 에이전트 워크플로, 장기 컴퓨터 활용에 최적화되어 있습니다. 강력한 멀티모달 기능, 프롬프트 주입에 대한 향상된 견고성, 작업에 따라 속도·깊이·토큰 사용량을 조절할 수 있는 새로운 강도 매개변수를 제공합니다. 자율 연구, 다단계 디버깅, 스프레드시트와 브라우저 조작, 다중 에이전트 조율에 뛰어나며, 구조화된 추론과 실행 신뢰성에서 대폭 향상되었습니다.

Anthropic ProAnthropic Max (5x)Anthropic Max (20x)API|비전심층 사고웹 검색파일|상용 모델
학습 완료일
2025-08-01
입력 형식 → 출력 형식
처리용량
200KIN64KOUT
개별 비용(백만 글자)
$5IN$25OUT
비용 계산하기

AI 성능 평가

Arena 종합 점수
1473
±4
집계일 2026-04-20
종합 순위
14위
37,167 투표수
Arena 능력별 점수
한국어 능력
1405±2631위
복잡한 질문
1500±59위
전문 지식
1505±139위
지시 이행
1485±76위
대화 기억
1487±812위
창의력
1468±98위
코딩 실력
1531±77위
수학 능력
1470±1314위
Arena 직군별 점수
문학·창작
1465±79위
생활·사회과학
1489±810위
엔터·미디어
1457±810위
경영·금융
1468±818위
의학·보건
1489±1317위
법률·행정
1488±1210위
소프트웨어·IT
1513±611위
수학·통계
1471±1516위
종합
AA Intelligence Index
50%↑11%
LiveBench
54%↓7%
ForecastBench
60%↑1%
추론·수학
AA Math Index
91%↑18%
GPQA Diamond
87%↑5%
HLE
28%↑11%
MMLU-Pro
90%↑8%
AIME 2025
91%↑18%
LB 추론
48%↓12%
LB 수학
64%↓9%
LB 데이터 분석
44%↓5%
코딩
AA Coding Index
48%↑14%
LiveCodeBench
87%↑22%
LB 코딩
78%↑5%
LB 에이전틱
50%↑7%
TAU2
90%↑16%
TerminalBench
47%↑16%
SciCode
50%↑9%
언어·지시
IFBench
58%↑1%
AA-LCR
74%↑12%
환각률 (HHEM)
11%↑1%
사실 일관성 (HHEM)
89%↓1%
LB 언어
77%↑5%
LB 지시
29%↓17%
출력 속도
일반 모드
51tok/s↓31
출력 시작 1.21s
추론 모드
73tok/s↓15
출력 시작 11.63s