AI 比較

Claude Opus 4.5は、複雑なソフトウェアエンジニアリング、エージェントワークフロー、および長期的なコンピュータ操作に最適化されたAnthropicの最先端推論モデルです。強力なマルチモーダル機能に加え、実際のコーディングや推論のベンチマークにおいて高い競争力を発揮し、プロンプトインジェクションに対する堅牢性も向上しています。本モデルは多様な負荷レベルで効率的に動作するよう設計されており、開発者はタスクの要件に応じて速度、深さ、トークン使用量を調整可能です。OpenRouterのVerbosityパラメータ（low, medium, high）を使用してトークン効率を制御できる新しいパラメータも導入されました。Opus 4.5は高度なツール利用、拡張されたコンテキスト管理、および協調的なマルチエージェント構成をサポートしており、自律的なリサーチ、デバッグ、多段階の計画立案、スプレッドシートやブラウザの操作に最適です。前世代のOpusと比較して、構造的な推論、実行の信頼性、アライメントが大幅に強化されており、トークンオーバーヘッドの削減と長時間タスクにおけるパフォーマンス向上が実現されています。

提供元

Claude

リリース日

2025-11-24

学習完了日

2025-08-01

ライセンス

商用モデル

入出力形式

コンテキスト長

200K / 64K

API入出力 (1M)

$5 / $25

利用方法

Claude Pro 以上 / API連携

出力速度

51 tok/s

Arena 総合

1474

Intelligence Index

49.7

Coding Index

47.8

Math Index

91.3

LiveBench

53.6

ForecastBench

60.1

GPQA Diamond

86.6%

HLE

28.4%

MMLU-Pro

89.5%

AIME 2025

91.3%

MATH-500

—

LB 推論

47.8

LB 数学

64.1

LB データ分析

44.2

LiveCodeBench

87.1%

LB コーディング

78.2

LB エージェンティック

50.0

TAU2

89.5%

TerminalBench

47.0%

SciCode

49.5%

IFBench

58.0%

AA-LCR

0.7

幻覚率 (HHEM)

10.9%

事実一貫性 (HHEM)

89.1%

LB 言語

77.2

LB 指示

28.9

AIモデル詳細ページ

1 / 3

좌우로 스와이프하여 전환

提供元

Claude

リリース日

2025-11-24

学習完了日

2025-08-01

ライセンス

商用モデル

入出力形式

コンテキスト長

200K / 64K

API入出力 (1M)

$5 / $25

利用方法

Claude Pro 以上 / API連携

出力速度

51 tok/s

Arena 総合

1474

Intelligence Index

49.7

Coding Index

47.8

Math Index

91.3

LiveBench

53.6

ForecastBench

60.1

GPQA Diamond

86.6%

HLE

28.4%

MMLU-Pro

89.5%

AIME 2025

91.3%

MATH-500

—

LB 推論

47.8

LB 数学

64.1

LB データ分析

44.2

LiveCodeBench

87.1%

LB コーディング

78.2

LB エージェンティック

50.0

TAU2

89.5%

TerminalBench

47.0%

SciCode

49.5%

IFBench

58.0%

AA-LCR

0.7

幻覚率 (HHEM)

10.9%

事実一貫性 (HHEM)

89.1%

LB 言語

77.2

LB 指示

28.9

AIモデル詳細ページ