Claude
Claude Opus 4
Model ID:claude-opus-4-20250514
2025-05-22상용 모델
API
종합17위
인기56위
Claude Opus 4는 출시 시점 기준으로 세계 최고의 코딩 모델로 평가받으며, 복잡하고 긴 작업 및 에이전트 워크플로우에서 지속적인 성능을 발휘합니다. 소프트웨어 엔지니어링 분야에서 새로운 기준을 제시하며, SWE-bench(72.5%)와 Terminal-bench(43.2%)에서 업계 최고 수준의 성과를 달성했습니다. Opus 4는 확장된 에이전트 워크플로우를 지원하여, 수천 단계의 작업을 성능 저하 없이 수 시간 동안 연속적으로 처리할 수 있습니다.
학습 완료일
2025-01-31
이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.
입력 형식 → 출력 형식
이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.
처리용량
200KIN32KOUT
한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.
개별 비용(백만 글자)
$15IN$75OUT
이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.
AI 성능 평가
Arena 종합 점수
1424
±4집계일 2026-04-02
종합 순위
56위
37,191 투표수
Arena 능력별 점수
한국어 능력
1380±2340위
복잡한 질문
1456±644위
전문 지식
1447±1450위
지시 이행
1442±727위
대화 기억
1437±846위
창의력
1431±926위
코딩 실력
1498±830위
수학 능력
1418±1261위
Arena 직군별 점수
문학·창작
1429±730위
생활·사회과학
1440±861위
엔터·미디어
1420±831위
경영·금융
1412±871위
의학·보건
1447±1356위
법률·행정
1435±1256위
소프트웨어·IT
1467±644위
수학·통계
1423±1363위
추론 능력
AA Intelligence Index
39%↑0%
MMLU-Pro
87%↑5%
GPQA Diamond
80%↓2%
HLE
12%↓5%
수학
AA Math Index
73%↓1%
MATH-500
98%↑4%
AIME 2024
76%↑16%
AIME 2025
73%↓1%
코딩 실력
AA Coding Index
34%↓2%
LiveCodeBench
64%↓2%
SciCode
40%↓2%
TerminalBench
31%↓3%
지시 이행
IFBench
54%↓4%
환각률 (HHEM)
12%↑1%
사실 일관성 (HHEM)
88%↓1%
장문 이해
AA-LCR
34%↓30%
에이전틱 AI 능력
TAU2
73%↑2%
속도
일반 모드
34tok/sec↓44
출력 시작 1.33s
Artificial Analysis
추론 모드
36tok/sec↓37
출력 시작 7.11s
Artificial Analysis