Claude
Claude

Claude Opus 4

Model ID:claude-opus-4-20250514
2025-05-22商用モデル
API
総合17位
人気56位

Claude Opus 4は、リリース時点で世界最高性能のコーディングモデルとして評価されており、複雑で長時間にわたるタスクやエージェントワークフローにおいて一貫したパフォーマンスを発揮します。ソフトウェアエンジニアリングの分野で新たな基準を打ち立て、SWE-bench(72.5%)およびTerminal-bench(43.2%)で業界トップクラスの成果を達成しました。Opus 4は拡張性の高いエージェントワークフローをサポートしており、数千ステップに及ぶタスクを数時間にわたって性能を落とすことなく継続的に処理可能です。

学習完了日
2025-01-31

このAIが学習を終えた日付です。それ以降に起きた出来事や情報は知らない場合があります。

入力形式 → 出力形式

このAIに渡せる情報の種類と、AIが生成できる結果の種類を示しています。

処理容量
200KIN32KOUT

1回のリクエストでAIが一度に読んで処理できる最大量です。数値が大きいほど、長い文書や会話を扱えます。

単価(100万文字)
$15IN$75OUT

このAIを直接連携して使用する際にかかる費用です。テキスト100万単位(トークン)あたりのドル換算で表示されます。

AI性能評価

Arena 総合点数
1424
±4
集計日 2026-04-02
総合ランク
56位
37,191 投票数
Arena 能力別スコア
日本語能力
1386±2330位
複雑な質問
1456±644位
専門知識
1447±1450位
指示遂行
1442±727位
会話記憶
1437±846位
創造力
1431±926位
コード作成
1498±830位
数学力
1418±1261位
Arena 職種別スコア
文学·創作
1429±730位
生活·社会
1440±861位
エンタメ
1420±831位
経営·金融
1412±871位
医学·保健
1447±1356位
法律·行政
1435±1256位
ソフト開発
1467±644位
数学·統計
1423±1363位
推論能力
AA Intelligence Index
39%↑0%
MMLU-Pro
87%↑5%
GPQA Diamond
80%↓2%
HLE
12%↓5%
数学
AA Math Index
73%↓1%
MATH-500
98%↑4%
AIME 2024
76%↑16%
AIME 2025
73%↓1%
コーディング力
AA Coding Index
34%↓2%
LiveCodeBench
64%↓2%
SciCode
40%↓2%
TerminalBench
31%↓3%
指示遂行
IFBench
54%↓4%
환각률 (HHEM)
12%↑1%
사실 일관성 (HHEM)
88%↓1%
長文理解
AA-LCR
34%↓30%
エージェントAI能力
TAU2
73%↑2%
速度
標準モード
34tok/sec↓44
出力開始 1.33s
Artificial Analysis
推論モード
36tok/sec↓37
出力開始 7.11s
Artificial Analysis