DeepSeek
DeepSeek

DeepSeek V4 Flash

2026-04-24

DeepSeek V4 Flash는 2026년 4월 24일에 공개된 V4 시리즈의 소형·저지연 모델로, 총 파라미터 284B(활성 13B)를 갖추고 장문 컨텍스트 추론 능력을 유지하면서도 비용 효율적인 추론을 목표로 설계되었습니다. V4 Pro와 동일한 압축 희소 어텐션(CSA)과 고도 압축 어텐션(HCA) 구조를 공유하며, 100만 토큰 컨텍스트 윈도우 전체에서 'Thinking'과 'Non-Thinking' 듀얼 모드를 지원합니다. 크기는 훨씬 작지만, V4 Flash 베이스 모델은 대부분의 벤치마크, 특히 장문 컨텍스트 작업에서 훨씬 큰 V3.2 베이스 모델을 능가합니다. 입력 100만 토큰당 $0.14, 출력 $0.28의 프론티어급 최저 수준 가격으로, 고처리량 에이전트 작업과 문서 처리 워크로드에 이상적입니다.

심층 사고|상용 모델
학습 완료일
2025-05
입력 형식 → 출력 형식
처리용량
1.0MIN384KOUT
개별 비용(백만 글자)
$0.14IN$0.28OUT
비용 계산하기

AI 성능 평가

Arena 종합 점수
1439
±9
집계일 2026-05-01
종합 순위
55위
3,603 투표수
Arena 능력별 점수
복잡한 질문
1463±1250위
전문 지식
1456±2958위
지시 이행
1428±1656위
대화 기억
1443±2358위
창의력
1404±2259위
코딩 실력
1480±1958위
수학 능력
1441±3646위
Arena 직군별 점수
문학·창작
1419±1952위
생활·사회과학
1460±2249위
엔터·미디어
1404±2158위
경영·금융
1432±2162위
의학·보건
1466±3550위
법률·행정
1468±3231위
소프트웨어·IT
1477±1551위
수학·통계
1449±4042위
종합
AA Intelligence Index
47%↑7%
LiveBench
68%↑7%
추론·수학
GPQA Diamond
89%↑7%
HLE
32%↑15%
LB 추론
71%↑2%
LB 수학
80%↑5%
LB 데이터 분석
68%↑15%
코딩
AA Coding Index
39%↑2%
LB 코딩
69%↓4%
LB 에이전틱
50%↑5%
TAU2
95%↑15%
TerminalBench
36%↑2%
SciCode
45%↑3%
언어·지시
IFBench
79%↑16%
AA-LCR
63%↑1%
LB 언어
70%↓2%
LB 지시
63%↑12%
출력 속도
일반 모드
68tok/s↓9
출력 시작 0.78s