Claude

Claude Sonnet 4

Model ID:claude-sonnet-4-20250514

2025-05-22상용 모델

API

종합18위

인기94위

Claude Sonnet 4는 이전 모델인 Sonnet 3.7의 기능을 대폭 강화하여, 코딩과 추론 작업에서 더욱 정밀하고 제어 가능한 성능을 보여줍니다. SWE-bench에서 72.7%라는 최고 수준의 성능을 달성한 Sonnet 4는 뛰어난 역량과 연산 효율성 사이의 균형을 갖추어, 일상적인 코딩부터 복잡한 소프트웨어 개발 프로젝트까지 폭넓게 활용할 수 있습니다. 주요 개선 사항으로는 자율적인 코드베이스 탐색 기능 향상, 에이전트 기반 워크플로우에서의 오류율 감소, 그리고 복잡한 지시 사항을 따르는 신뢰성 강화가 있습니다. Sonnet 4는 실용적인 일상 업무에 최적화되어 있으며, 다양한 내외부 환경에서 효율성과 반응성을 유지하면서도 고도의 추론 능력을 제공합니다. 자세한 내용은 [블로그 게시물](https://www.anthropic.com/news/claude-4)에서 확인하실 수 있습니다.

학습 완료일

2025-01-31

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량

200KIN64KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)

$3IN$15OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

출처:공식 문서 OpenRouter

AI 성능 평가

Arena 종합 점수

1399

±4

집계일 2026-04-02

종합 순위

94위

35,417 투표수

Arena 능력별 점수

한국어 능력

1335±2388위

복잡한 질문

1431±675위

전문 지식

1435±1466위

지시 이행

1414±758위

대화 기억

1419±866위

창의력

1395±959위

코딩 실력

1473±850위

수학 능력

1402±1388위

Arena 직군별 점수

문학·창작

1397±768위

생활·사회과학

1418±887위

엔터·미디어

1388±866위

경영·금융

1385±8107위

의학·보건

1420±1395위

법률·행정

1409±1387위

소프트웨어·IT

1443±677위

수학·통계

1409±1391위

출처:Arena Intelligence

추론 능력

AA Intelligence Index

39%↑0%

MMLU-Pro

84%↑2%

GPQA Diamond

78%↓4%

HLE

9.6%↓7%

수학

AA Math Index

74%↑0%

MATH-500

99%↑5%

AIME 2024

77%↑18%

AIME 2025

74%↑0%

코딩 실력

AA Coding Index

34%↓2%

LiveCodeBench

66%↑0%

SciCode

40%↓2%

TerminalBench

31%↓3%

지시 이행

IFBench

55%↓3%

환각률 (HHEM)

10%↑0%

사실 일관성 (HHEM)

90%↑0%

장문 이해

AA-LCR

65%↑1%

에이전틱 AI 능력

TAU2

65%↓7%

속도

일반 모드

45tok/sec↓33

출력 시작 0.80s

Artificial Analysis

추론 모드

46tok/sec↓27

출력 시작 8.30s

Artificial Analysis

출처:Artificial Analysis Vectara HHEM

← AI 모델 목록으로