Claude Opus 4.7は、Opus 4.6の後継として2026年4月16日にリリースされたAnthropicのフラッグシップモデルです。Anthropic史上最も強力なコーディングおよびエージェントモデルであり、最小限の監督で長期間の自律的な作業を遂行できるよう設計されています。Opus 4.7は慎重に計画を立て、タスク完了を宣言する前に検証ステップ(テスト、実行、修正)を実行し、ファイルシステムメモリを使用してセッション間でコンテキストを保持します。新しい制御機能として、タスク予算の設定や、'high'と'max'の中間に位置する'xhigh'の努力レベルが追加されました。リリース時にはSWE-bench Verifiedで87.6%、SWE-bench Proで64.3%を記録してGPT-5.4やGemini 3.1 Proを上回り、Terminal-bench 2.0で69.4%、ARC-AGI-2で約77%のスコアを達成しました。ビジョン機能は3倍に強化され、98.5%のコンピュータ使用時の視覚的精度を実現しています。また、100万トークンのコンテキストウィンドウと128Kの出力容量を備えています。
ビジョン深い思考Web検索ファイル|商用モデル
出典:公式ドキュメント
AI性能評価
Arena 総合点数
1504
±9集計日 2026-04-20
総合ランク
🥇 1位
3,898 投票数
Arena 能力別スコア
複雑な質問
1527±12🥉 3位
専門知識
1562±28🥇 1位
指示遂行
1504±17🥈 2位
会話記憶
1519±26🥈 2位
創造力
1499±23🥇 1位
コード作成
1571±19🥇 1位
数学力
1503±405位
Arena 職種別スコア
文学·創作
1504±20🥇 1位
生活·社会
1525±22🥇 1位
エンタメ
1474±214位
経営·金融
1496±224位
医学·保健
1523±36🥈 2位
法律·行政
1517±35🥇 1位
ソフト開発
1555±15🥇 1位
数学·統計
1508±384位
総合
AA Intelligence Index
57%↑19%
LiveBench
68%↑8%
推論·数学
GPQA Diamond
91%↑10%
HLE
40%↑23%
LB 推論
75%↑15%
LB 数学
76%↑3%
LB データ
76%↑26%
コーディング
AA Coding Index
53%↑18%
LB コード
76%↑3%
LB エージェント
60%↑17%
TAU2
89%↑15%
TerminalBench
52%↑20%
SciCode
55%↑14%
言語·指示
IFBench
59%↑2%
AA-LCR
70%↑9%
幻覚率 (HHEM)
12%↑2%
事実一貫性 (HHEM)
88%↓2%
LB 言語
75%↑3%
LB 指示
46%↑0%
出力速度
標準モード
60tok/s↓22
出力開始 1.26s
推論モード
60tok/s↓28
出力開始 11.87s