Claude

Claude Sonnet 4

Model ID:claude-sonnet-4-20250514

2025-05-22商用モデル

API

総合18位

人気94位

Claude Sonnet 4は、前モデルであるSonnet 3.7の機能を大幅に強化し、コーディングと推論の両タスクにおいて、より高い精度と制御性を実現しました。SWE-benchで72.7%という最高水準のパフォーマンスを達成したSonnet 4は、優れた能力と計算効率のバランスが取れており、日常的なコーディングから複雑なソフトウェア開発プロジェクトまで、幅広い用途に適しています。主な改善点として、自律的なコードベース探索機能の向上、エージェント駆動型ワークフローにおけるエラー率の低減、そして複雑な指示に従う際の信頼性が強化されました。Sonnet 4は実用的な日常利用に最適化されており、多様な社内外のシナリオにおいて、効率性と応答性を維持しながら高度な推論能力を提供します。詳細は[こちらのブログ記事](https://www.anthropic.com/news/claude-4)をご覧ください。

学習完了日

2025-01-31

このAIが学習を終えた日付です。それ以降に起きた出来事や情報は知らない場合があります。

入力形式 → 出力形式

このAIに渡せる情報の種類と、AIが生成できる結果の種類を示しています。

処理容量

200KIN64KOUT

1回のリクエストでAIが一度に読んで処理できる最大量です。数値が大きいほど、長い文書や会話を扱えます。

単価（100万文字）

$3IN$15OUT

このAIを直接連携して使用する際にかかる費用です。テキスト100万単位（トークン）あたりのドル換算で表示されます。

出典:公式ドキュメント OpenRouter

AI性能評価

Arena 総合点数

1399

±4

集計日 2026-04-02

総合ランク

94位

35,417 投票数

Arena 能力別スコア

日本語能力

1345±2361位

複雑な質問

1431±675位

専門知識

1435±1466位

指示遂行

1414±758位

会話記憶

1419±866位

創造力

1395±959位

コード作成

1473±850位

数学力

1402±1388位

Arena 職種別スコア

文学·創作

1397±768位

生活·社会

1418±887位

エンタメ

1388±866位

経営·金融

1385±8107位

医学·保健

1420±1395位

法律·行政

1409±1387位

ソフト開発

1443±677位

数学·統計

1409±1391位

出典:Arena Intelligence

推論能力

AA Intelligence Index

39%↑0%

MMLU-Pro

84%↑2%

GPQA Diamond

78%↓4%

HLE

9.6%↓7%

数学

AA Math Index

74%↑0%

MATH-500

99%↑5%

AIME 2024

77%↑18%

AIME 2025

74%↑0%

コーディング力

AA Coding Index

34%↓2%

LiveCodeBench

66%↑0%

SciCode

40%↓2%

TerminalBench

31%↓3%

指示遂行

IFBench

55%↓3%

환각률 (HHEM)

10%↑0%

사실 일관성 (HHEM)

90%↑0%

長文理解

AA-LCR

65%↑1%

エージェントAI能力

TAU2

65%↓7%

速度

標準モード

45tok/sec↓33

出力開始 0.80s

Artificial Analysis

推論モード

46tok/sec↓27

出力開始 8.30s

Artificial Analysis

出典:Artificial Analysis Vectara HHEM

← AIモデル一覧へ