Gemini 3 Flash는 Pro급에 가까운 지능을 Flash 라인의 속도와 비용 효율로 결합한 Google의 고속 추론 모델입니다. 대부분의 벤치마크에서 Gemini 2.5 Pro를 상회하면서 3배 빠른 속도와 훨씬 낮은 비용으로 작동하며, SWE-bench Verified에서 78%를 기록합니다. 100만 토큰 컨텍스트 창, 멀티모달 입력(텍스트, 이미지, 오디오, 동영상, PDF), 설정 가능한 사고 수준, 자동 컨텍스트 캐싱을 지원하여 에이전트 워크플로, 다중 대화, 대화형 코딩 어시스턴트에 적합합니다.
제공사
Google출시일
2025-12-17
학습완료일
2025-01-31
라이선스
상용 모델
입출력 형식
처리용량
1.0M / 66K
API 입출력 (1M)
$0.5 / $3
사용 방법
Google AI Free 이상 / API 연결
출력 속도
177 tok/sArena 종합
1474Intelligence Index
46.4Coding Index
42.6Math Index
97.0LiveBench
54.4ForecastBench
59.0GPQA Diamond
89.8%HLE
34.7%MMLU-Pro
89.0%AIME 2025
97.0%MATH-500
—LB 추론
49.2LB 수학
68.1LB 데이터 분석
48.3LiveCodeBench
90.8%LB 코딩
78.6LB 에이전틱
43.3TAU2
80.4%TerminalBench
38.6%SciCode
50.6%IFBench
78.0%AA-LCR
0.7환각률 (HHEM)
13.5%사실 일관성 (HHEM)
86.5%LB 언어
78.7LB 지시
28.31 / 3
좌우로 스와이프
Gemini 3 Flash는 Pro급에 가까운 지능을 Flash 라인의 속도와 비용 효율로 결합한 Google의 고속 추론 모델입니다. 대부분의 벤치마크에서 Gemini 2.5 Pro를 상회하면서 3배 빠른 속도와 훨씬 낮은 비용으로 작동하며, SWE-bench Verified에서 78%를 기록합니다. 100만 토큰 컨텍스트 창, 멀티모달 입력(텍스트, 이미지, 오디오, 동영상, PDF), 설정 가능한 사고 수준, 자동 컨텍스트 캐싱을 지원하여 에이전트 워크플로, 다중 대화, 대화형 코딩 어시스턴트에 적합합니다.
제공사
Google출시일
2025-12-17
학습완료일
2025-01-31
라이선스
상용 모델
입출력 형식
처리용량
1.0M / 66K
API 입출력 (1M)
$0.5 / $3
사용 방법
Google AI Free 이상 / API 연결
출력 속도
177 tok/sArena 종합
1474Intelligence Index
46.4Coding Index
42.6Math Index
97.0LiveBench
54.4ForecastBench
59.0GPQA Diamond
89.8%HLE
34.7%MMLU-Pro
89.0%AIME 2025
97.0%MATH-500
—LB 추론
49.2LB 수학
68.1LB 데이터 분석
48.3LiveCodeBench
90.8%LB 코딩
78.6LB 에이전틱
43.3TAU2
80.4%TerminalBench
38.6%SciCode
50.6%IFBench
78.0%AA-LCR
0.7환각률 (HHEM)
13.5%사실 일관성 (HHEM)
86.5%LB 언어
78.7LB 지시
28.3