AI 比較

Claude Sonnet 4は、前モデルであるSonnet 3.7の機能を大幅に強化し、コーディングと推論の両タスクにおいて、より高い精度と制御性を実現しました。SWE-benchで72.7%という最高水準のパフォーマンスを達成したSonnet 4は、優れた能力と計算効率のバランスが取れており、日常的なコーディングから複雑なソフトウェア開発プロジェクトまで、幅広い用途に適しています。主な改善点として、自律的なコードベース探索機能の向上、エージェント駆動型ワークフローにおけるエラー率の低減、そして複雑な指示に従う際の信頼性が強化されました。Sonnet 4は実用的な日常利用に最適化されており、多様な社内外のシナリオにおいて、効率性と応答性を維持しながら高度な推論能力を提供します。詳細は

提供元

Anthropic

リリース日

2025-05-22

学習完了日

2025-01-31

ライセンス

商用モデル

入出力形式

コンテキスト長

1M / 64K

API入出力 (1M)

$3 / $15

利用方法

API連携

出力速度

45 tok/s

Arena 総合

1399

Intelligence Index

38.7

Coding Index

34.1

Math Index

74.3

LiveBench

—

ForecastBench

58.7

GPQA Diamond

77.7%

HLE

9.6%

MMLU-Pro

84.2%

AIME 2025

74.3%

MATH-500

99.1%

LB 推論

—

LB 数学

—

LB データ分析

—

LiveCodeBench

65.5%

LB コーディング

—

LB エージェンティック

—

TAU2

64.6%

TerminalBench

31.1%

SciCode

40.0%

IFBench

54.7%

AA-LCR

0.6

幻覚率 (HHEM)

10.3%

事実一貫性 (HHEM)

89.7%

LB 言語

—

LB 指示

—

AIモデル詳細ページ

1 / 3

좌우로 스와이프하여 전환

提供元