AI 比較

1 / 3
좌우로 스와이프하여 전환

Claude Opus 4は、リリース時点で世界最高性能のコーディングモデルとして評価されており、複雑で長時間にわたるタスクやエージェントワークフローにおいて一貫したパフォーマンスを発揮します。ソフトウェアエンジニアリングの分野で新たな基準を打ち立て、SWE-bench(72.5%)およびTerminal-bench(43.2%)で業界トップクラスの成果を達成しました。Opus 4は拡張性の高いエージェントワークフローをサポートしており、数千ステップに及ぶタスクを数時間にわたって性能を落とすことなく継続的に処理可能です。

提供元
ClaudeClaude
リリース日
2025-05-22
学習完了日
2025-01-31
ライセンス
商用モデル
入出力形式
コンテキスト長
200K / 32K
API入出力 (1M)
$15 / $75
利用方法
API連携
出力速度
34 tok/s
Arena 総合
1424
Intelligence Index
39.0
Coding Index
34.0
Math Index
73.3
LiveBench
ForecastBench
60.5
GPQA Diamond
79.6%
HLE
11.7%
MMLU-Pro
87.3%
AIME 2025
73.3%
MATH-500
98.2%
LB 推論
LB 数学
LB データ分析
LiveCodeBench
63.6%
LB コーディング
LB エージェンティック
TAU2
73.4%
TerminalBench
31.1%
SciCode
39.8%
IFBench
53.7%
AA-LCR
0.3
幻覚率 (HHEM)
12.0%
事実一貫性 (HHEM)
88.0%
LB 言語
LB 指示