Claude

Claude Opus 4

Model ID:claude-opus-4-20250514

2025-05-22商用モデル

API

総合17位

人気56位

Claude Opus 4は、リリース時点で世界最高性能のコーディングモデルとして評価されており、複雑で長時間にわたるタスクやエージェントワークフローにおいて一貫したパフォーマンスを発揮します。ソフトウェアエンジニアリングの分野で新たな基準を打ち立て、SWE-bench（72.5%）およびTerminal-bench（43.2%）で業界トップクラスの成果を達成しました。Opus 4は拡張性の高いエージェントワークフローをサポートしており、数千ステップに及ぶタスクを数時間にわたって性能を落とすことなく継続的に処理可能です。

学習完了日

2025-01-31

このAIが学習を終えた日付です。それ以降に起きた出来事や情報は知らない場合があります。

入力形式 → 出力形式

このAIに渡せる情報の種類と、AIが生成できる結果の種類を示しています。

処理容量

200KIN32KOUT

1回のリクエストでAIが一度に読んで処理できる最大量です。数値が大きいほど、長い文書や会話を扱えます。

単価（100万文字）

$15IN$75OUT

このAIを直接連携して使用する際にかかる費用です。テキスト100万単位（トークン）あたりのドル換算で表示されます。

出典:公式ドキュメント OpenRouter

AI性能評価

Arena 総合点数

1424

±4

集計日 2026-04-02

総合ランク

56位

37,191 投票数

Arena 能力別スコア

日本語能力

1386±2330位

複雑な質問

1456±644位

専門知識

1447±1450位

指示遂行

1442±727位

会話記憶

1437±846位

創造力

1431±926位

コード作成

1498±830位

数学力

1418±1261位

Arena 職種別スコア

文学·創作

1429±730位

生活·社会

1440±861位

エンタメ

1420±831位

経営·金融

1412±871位

医学·保健

1447±1356位

法律·行政

1435±1256位

ソフト開発

1467±644位

数学·統計

1423±1363位

出典:Arena Intelligence

推論能力

AA Intelligence Index

39%↑0%

MMLU-Pro

87%↑5%

GPQA Diamond

80%↓2%

HLE

12%↓5%

数学

AA Math Index

73%↓1%

MATH-500

98%↑4%

AIME 2024

76%↑16%

AIME 2025

73%↓1%

コーディング力

AA Coding Index

34%↓2%

LiveCodeBench

64%↓2%

SciCode

40%↓2%

TerminalBench

31%↓3%

指示遂行

IFBench

54%↓4%

환각률 (HHEM)

12%↑1%

사실 일관성 (HHEM)

88%↓1%

長文理解

AA-LCR

34%↓30%

エージェントAI能力

TAU2

73%↑2%

速度

標準モード

34tok/sec↓44

出力開始 1.33s

Artificial Analysis

推論モード

36tok/sec↓37

出力開始 7.11s

Artificial Analysis

出典:Artificial Analysis Vectara HHEM

← AIモデル一覧へ