Claude
Claude

Claude Sonnet 4

Model ID:claude-sonnet-4-20250514
2025-05-22商用モデル
API
総合18位
人気94位

Claude Sonnet 4は、前モデルであるSonnet 3.7の機能を大幅に強化し、コーディングと推論の両タスクにおいて、より高い精度と制御性を実現しました。SWE-benchで72.7%という最高水準のパフォーマンスを達成したSonnet 4は、優れた能力と計算効率のバランスが取れており、日常的なコーディングから複雑なソフトウェア開発プロジェクトまで、幅広い用途に適しています。主な改善点として、自律的なコードベース探索機能の向上、エージェント駆動型ワークフローにおけるエラー率の低減、そして複雑な指示に従う際の信頼性が強化されました。Sonnet 4は実用的な日常利用に最適化されており、多様な社内外のシナリオにおいて、効率性と応答性を維持しながら高度な推論能力を提供します。詳細は[こちらのブログ記事](https://www.anthropic.com/news/claude-4)をご覧ください。

学習完了日
2025-01-31

このAIが学習を終えた日付です。それ以降に起きた出来事や情報は知らない場合があります。

入力形式 → 出力形式

このAIに渡せる情報の種類と、AIが生成できる結果の種類を示しています。

処理容量
200KIN64KOUT

1回のリクエストでAIが一度に読んで処理できる最大量です。数値が大きいほど、長い文書や会話を扱えます。

単価(100万文字)
$3IN$15OUT

このAIを直接連携して使用する際にかかる費用です。テキスト100万単位(トークン)あたりのドル換算で表示されます。

AI性能評価

Arena 総合点数
1399
±4
集計日 2026-04-02
総合ランク
94位
35,417 投票数
Arena 能力別スコア
日本語能力
1345±2361位
複雑な質問
1431±675位
専門知識
1435±1466位
指示遂行
1414±758位
会話記憶
1419±866位
創造力
1395±959位
コード作成
1473±850位
数学力
1402±1388位
Arena 職種別スコア
文学·創作
1397±768位
生活·社会
1418±887位
エンタメ
1388±866位
経営·金融
1385±8107位
医学·保健
1420±1395位
法律·行政
1409±1387位
ソフト開発
1443±677位
数学·統計
1409±1391位
推論能力
AA Intelligence Index
39%↑0%
MMLU-Pro
84%↑2%
GPQA Diamond
78%↓4%
HLE
9.6%↓7%
数学
AA Math Index
74%↑0%
MATH-500
99%↑5%
AIME 2024
77%↑18%
AIME 2025
74%↑0%
コーディング力
AA Coding Index
34%↓2%
LiveCodeBench
66%↑0%
SciCode
40%↓2%
TerminalBench
31%↓3%
指示遂行
IFBench
55%↓3%
환각률 (HHEM)
10%↑0%
사실 일관성 (HHEM)
90%↑0%
長文理解
AA-LCR
65%↑1%
エージェントAI能力
TAU2
65%↓7%
速度
標準モード
45tok/sec↓33
出力開始 0.80s
Artificial Analysis
推論モード
46tok/sec↓27
出力開始 8.30s
Artificial Analysis