Claude

Claude Opus 4

Model ID:claude-opus-4-20250514

2025-05-22상용 모델

API

종합17위

인기56위

Claude Opus 4는 출시 시점 기준으로 세계 최고의 코딩 모델로 평가받으며, 복잡하고 긴 작업 및 에이전트 워크플로우에서 지속적인 성능을 발휘합니다. 소프트웨어 엔지니어링 분야에서 새로운 기준을 제시하며, SWE-bench(72.5%)와 Terminal-bench(43.2%)에서 업계 최고 수준의 성과를 달성했습니다. Opus 4는 확장된 에이전트 워크플로우를 지원하여, 수천 단계의 작업을 성능 저하 없이 수 시간 동안 연속적으로 처리할 수 있습니다.

학습 완료일

2025-01-31

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량

200KIN32KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)

$15IN$75OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

출처:공식 문서 OpenRouter

AI 성능 평가

Arena 종합 점수

1424

±4

집계일 2026-04-02

종합 순위

56위

37,191 투표수

Arena 능력별 점수

한국어 능력

1380±2340위

복잡한 질문

1456±644위

전문 지식

1447±1450위

지시 이행

1442±727위

대화 기억

1437±846위

창의력

1431±926위

코딩 실력

1498±830위

수학 능력

1418±1261위

Arena 직군별 점수

문학·창작

1429±730위

생활·사회과학

1440±861위

엔터·미디어

1420±831위

경영·금융

1412±871위

의학·보건

1447±1356위

법률·행정

1435±1256위

소프트웨어·IT

1467±644위

수학·통계

1423±1363위

출처:Arena Intelligence

추론 능력

AA Intelligence Index

39%↑0%

MMLU-Pro

87%↑5%

GPQA Diamond

80%↓2%

HLE

12%↓5%

수학

AA Math Index

73%↓1%

MATH-500

98%↑4%

AIME 2024

76%↑16%

AIME 2025

73%↓1%

코딩 실력

AA Coding Index

34%↓2%

LiveCodeBench

64%↓2%

SciCode

40%↓2%

TerminalBench

31%↓3%

지시 이행

IFBench

54%↓4%

환각률 (HHEM)

12%↑1%

사실 일관성 (HHEM)

88%↓1%

장문 이해

AA-LCR

34%↓30%

에이전틱 AI 능력

TAU2

73%↑2%

속도

일반 모드

34tok/sec↓44

출력 시작 1.33s

Artificial Analysis

추론 모드

36tok/sec↓37

출력 시작 7.11s

Artificial Analysis

출처:Artificial Analysis Vectara HHEM

← AI 모델 목록으로