AI 비교하기

1 / 3
좌우로 스와이프하여 전환

Claude Opus 4.5는 복잡한 소프트웨어 엔지니어링, 에이전트 워크플로우, 장기적인 컴퓨터 사용에 최적화된 Anthropic의 최첨단 추론 모델입니다. 강력한 멀티모달 기능과 실제 코딩 및 추론 벤치마크에서의 경쟁력 있는 성능을 제공하며, 프롬프트 인젝션에 대한 보안성이 향상되었습니다. 이 모델은 다양한 작업 수준에서 효율적으로 작동하도록 설계되어, 개발자가 작업 요구 사항에 따라 속도, 깊이, 토큰 사용량을 조절할 수 있습니다. 또한 OpenRouter의 Verbosity 매개변수(low, medium, high)를 통해 토큰 효율성을 제어할 수 있는 새로운 기능이 추가되었습니다. Opus 4.5는 고급 도구 사용, 확장된 컨텍스트 관리, 다중 에이전트 협업을 지원하여 자율 연구, 디버깅, 다단계 계획, 스프레드시트 및 브라우저 조작에 최적화되어 있습니다. 이전 세대 대비 구조적 추론, 실행 신뢰성, 정렬 능력이 크게 향상되었으며, 토큰 오버헤드를 줄이고 장기 실행 작업에서의 성능을 개선했습니다.

제공사
ClaudeClaude
출시일
2025-11-24
학습완료일
2025-08-01
라이선스
상용 모델
입출력 형식
처리용량
200K / 64K
API 입출력 (1M)
$5 / $25
사용 방법
Claude Pro 이상 / API 연결
출력 속도
51 tok/s
Arena 종합
1474
Intelligence Index
49.7
Coding Index
47.8
Math Index
91.3
LiveBench
53.6
ForecastBench
60.1
GPQA Diamond
86.6%
HLE
28.4%
MMLU-Pro
89.5%
AIME 2025
91.3%
MATH-500
LB 추론
47.8
LB 수학
64.1
LB 데이터 분석
44.2
LiveCodeBench
87.1%
LB 코딩
78.2
LB 에이전틱
50.0
TAU2
89.5%
TerminalBench
47.0%
SciCode
49.5%
IFBench
58.0%
AA-LCR
0.7
환각률 (HHEM)
10.9%
사실 일관성 (HHEM)
89.1%
LB 언어
77.2
LB 지시
28.9