AI 比較

1 / 3
좌우로 스와이프하여 전환

Claude Sonnet 4は、前モデルであるSonnet 3.7の機能を大幅に強化し、コーディングと推論の両タスクにおいて、より高い精度と制御性を実現しました。SWE-benchで72.7%という最高水準のパフォーマンスを達成したSonnet 4は、優れた能力と計算効率のバランスが取れており、日常的なコーディングから複雑なソフトウェア開発プロジェクトまで、幅広い用途に適しています。主な改善点として、自律的なコードベース探索機能の向上、エージェント駆動型ワークフローにおけるエラー率の低減、そして複雑な指示に従う際の信頼性が強化されました。Sonnet 4は実用的な日常利用に最適化されており、多様な社内外のシナリオにおいて、効率性と応答性を維持しながら高度な推論能力を提供します。詳細は

提供元
AnthropicAnthropic
リリース日
2025-05-22
学習完了日
2025-01-31
ライセンス
商用モデル
入出力形式
コンテキスト長
1M / 64K
API入出力 (1M)
$3 / $15
利用方法
API連携
出力速度
45 tok/s
Arena 総合
1399
Intelligence Index
38.7
Coding Index
34.1
Math Index
74.3
LiveBench
ForecastBench
58.7
GPQA Diamond
77.7%
HLE
9.6%
MMLU-Pro
84.2%
AIME 2025
74.3%
MATH-500
99.1%
LB 推論
LB 数学
LB データ分析
LiveCodeBench
65.5%
LB コーディング
LB エージェンティック
TAU2
64.6%
TerminalBench
31.1%
SciCode
40.0%
IFBench
54.7%
AA-LCR
0.6
幻覚率 (HHEM)
10.3%
事実一貫性 (HHEM)
89.7%
LB 言語
LB 指示