AI 比較

1 / 3
좌우로 스와이프하여 전환

Claude Opus 4.5は、複雑なソフトウェアエンジニアリング、エージェントワークフロー、および長期的なコンピュータ操作に最適化されたAnthropicの最先端推論モデルです。強力なマルチモーダル機能に加え、実際のコーディングや推論のベンチマークにおいて高い競争力を発揮し、プロンプトインジェクションに対する堅牢性も向上しています。本モデルは多様な負荷レベルで効率的に動作するよう設計されており、開発者はタスクの要件に応じて速度、深さ、トークン使用量を調整可能です。OpenRouterのVerbosityパラメータ(low, medium, high)を使用してトークン効率を制御できる新しいパラメータも導入されました。Opus 4.5は高度なツール利用、拡張されたコンテキスト管理、および協調的なマルチエージェント構成をサポートしており、自律的なリサーチ、デバッグ、多段階の計画立案、スプレッドシートやブラウザの操作に最適です。前世代のOpusと比較して、構造的な推論、実行の信頼性、アライメントが大幅に強化されており、トークンオーバーヘッドの削減と長時間タスクにおけるパフォーマンス向上が実現されています。

提供元
ClaudeClaude
リリース日
2025-11-24
学習完了日
2025-08-01
ライセンス
商用モデル
入出力形式
コンテキスト長
200K / 64K
API入出力 (1M)
$5 / $25
利用方法
Claude Pro 以上 / API連携
出力速度
51 tok/s
Arena 総合
1474
Intelligence Index
49.7
Coding Index
47.8
Math Index
91.3
LiveBench
53.6
ForecastBench
60.1
GPQA Diamond
86.6%
HLE
28.4%
MMLU-Pro
89.5%
AIME 2025
91.3%
MATH-500
LB 推論
47.8
LB 数学
64.1
LB データ分析
44.2
LiveCodeBench
87.1%
LB コーディング
78.2
LB エージェンティック
50.0
TAU2
89.5%
TerminalBench
47.0%
SciCode
49.5%
IFBench
58.0%
AA-LCR
0.7
幻覚率 (HHEM)
10.9%
事実一貫性 (HHEM)
89.1%
LB 言語
77.2
LB 指示
28.9