Google
Google

Gemini 3.1 Pro

2026-02-19

Gemini 3.1 Pro는 Google의 가장 발전된 추론 모델로, 소프트웨어 엔지니어링, 에이전트 신뢰성, 토큰 효율 전반에서 Gemini 3 Pro를 크게 상회합니다. 텍스트, 이미지, 동영상, 오디오, 코드, PDF를 포함한 멀티모달 입력과 100만 토큰 컨텍스트 창을 지원하며, 비용·속도·성능 간 균형을 위한 새로운 중간 사고 수준을 도입했습니다. 에이전트형 코딩, 구조화된 계획, 재무 모델링, 스프레드시트 자동화, 장기적 안정성과 자율 도구 조율이 필요한 기업급 작업에 뛰어납니다.

Google AI PlusGoogle AI ProGoogle AI UltraAPI|비전심층 사고웹 검색파일|상용 모델
학습 완료일
2025-01-31
입력 형식 → 출력 형식
처리용량
1.0MIN66KOUT
개별 비용(백만 글자)
$2IN$12OUT
비용 계산하기

AI 성능 평가

Arena 종합 점수
1493
±5
집계일 2026-04-20
종합 순위
6위
23,766 투표수
Arena 능력별 점수
한국어 능력
1484±29🥇 1위
복잡한 질문
1515±65위
전문 지식
1519±146위
지시 이행
1489±85위
대화 기억
1507±106위
창의력
1489±104위
코딩 실력
1530±88위
수학 능력
1507±15🥉 3위
Arena 직군별 점수
문학·창작
1489±9🥉 3위
생활·사회과학
1514±10🥉 3위
엔터·미디어
1477±10🥉 3위
경영·금융
1483±98위
의학·보건
1508±158위
법률·행정
1505±146위
소프트웨어·IT
1519±76위
수학·통계
1498±175위
종합
AA Intelligence Index
57%↑19%
LiveBench
81%↑20%
ForecastBench
60%↑1%
추론·수학
GPQA Diamond
94%↑13%
HLE
45%↑28%
LB 추론
84%↑24%
LB 수학
91%↑17%
LB 데이터 분석
79%↑29%
코딩
AA Coding Index
56%↑21%
LB 코딩
76%↑3%
LB 에이전틱
65%↑22%
TAU2
96%↑22%
TerminalBench
54%↑23%
SciCode
59%↑18%
언어·지시
IFBench
77%↑20%
AA-LCR
73%↑11%
환각률 (HHEM)
10%↑0%
사실 일관성 (HHEM)
90%↑0%
LB 언어
85%↑14%
LB 지시
79%↑33%
출력 속도
일반 모드
127tok/s↑45
출력 시작 30.28s

다국어 역량

MGSM 🇰🇷
94%
MGSM 🇯🇵
94%
KMMLU 🇰🇷
82%
JMMLU 🇯🇵
82%