AI 비교하기

Claude Opus 4.5는 복잡한 소프트웨어 엔지니어링, 에이전트 워크플로우, 장기적인 컴퓨터 사용에 최적화된 Anthropic의 최첨단 추론 모델입니다. 강력한 멀티모달 기능과 실제 코딩 및 추론 벤치마크에서의 경쟁력 있는 성능을 제공하며, 프롬프트 인젝션에 대한 보안성이 향상되었습니다. 이 모델은 다양한 작업 수준에서 효율적으로 작동하도록 설계되어, 개발자가 작업 요구 사항에 따라 속도, 깊이, 토큰 사용량을 조절할 수 있습니다. 또한 OpenRouter의 Verbosity 매개변수(low, medium, high)를 통해 토큰 효율성을 제어할 수 있는 새로운 기능이 추가되었습니다. Opus 4.5는 고급 도구 사용, 확장된 컨텍스트 관리, 다중 에이전트 협업을 지원하여 자율 연구, 디버깅, 다단계 계획, 스프레드시트 및 브라우저 조작에 최적화되어 있습니다. 이전 세대 대비 구조적 추론, 실행 신뢰성, 정렬 능력이 크게 향상되었으며, 토큰 오버헤드를 줄이고 장기 실행 작업에서의 성능을 개선했습니다.

제공사

Claude

출시일

2025-11-24

학습완료일

2025-08-01

라이선스

상용 모델

입출력 형식

처리용량

200K / 64K

API 입출력 (1M)

$5 / $25

사용 방법

Claude Pro 이상 / API 연결

출력 속도

51 tok/s

Arena 종합

1474

Intelligence Index

49.7

Coding Index

47.8

Math Index

91.3

LiveBench

53.6

ForecastBench

60.1

GPQA Diamond

86.6%

HLE

28.4%

MMLU-Pro

89.5%

AIME 2025

91.3%

MATH-500

—

LB 추론

47.8

LB 수학

64.1

LB 데이터 분석

44.2

LiveCodeBench

87.1%

LB 코딩

78.2

LB 에이전틱

50.0

TAU2

89.5%

TerminalBench

47.0%

SciCode

49.5%

IFBench

58.0%

AA-LCR

0.7

환각률 (HHEM)

10.9%

사실 일관성 (HHEM)

89.1%

LB 언어

77.2

LB 지시

28.9

AI 모델 상세 페이지

1 / 3

좌우로 스와이프하여 전환

제공사

Claude

출시일

2025-11-24

학습완료일

2025-08-01

라이선스

상용 모델

입출력 형식

처리용량

200K / 64K

API 입출력 (1M)

$5 / $25

사용 방법

Claude Pro 이상 / API 연결

출력 속도

51 tok/s

Arena 종합

1474

Intelligence Index

49.7

Coding Index

47.8

Math Index

91.3

LiveBench

53.6

ForecastBench

60.1

GPQA Diamond

86.6%

HLE

28.4%

MMLU-Pro

89.5%

AIME 2025

91.3%

MATH-500

—

LB 추론

47.8

LB 수학

64.1

LB 데이터 분석

44.2

LiveCodeBench

87.1%

LB 코딩

78.2

LB 에이전틱

50.0

TAU2

89.5%

TerminalBench

47.0%

SciCode

49.5%

IFBench

58.0%

AA-LCR

0.7

환각률 (HHEM)

10.9%

사실 일관성 (HHEM)

89.1%

LB 언어

77.2

LB 지시

28.9

AI 모델 상세 페이지