NVIDIA
NVIDIA

Nemotron 3 Super

2026-03-11상용 모델

NVIDIA Nemotron 3 Super는 120B 파라미터 규모의 오픈 하이브리드 MoE 모델로, 복잡한 멀티 에이전트 애플리케이션에서 연산 효율성과 정확성을 극대화하기 위해 12B 파라미터만을 활성화합니다. 이 모델은 하이브리드 Mamba-Transformer 아키텍처를 기반으로 구축되었습니다.

추론
학습 완료일
2026-02-01
입력 형식 → 출력 형식
처리용량
262KIN1MOUT
개별 비용(백만 글자)
$0.1IN$0.5OUT
비용 계산하기

AI 성능 평가

종합
AA Intelligence Index
36%↓2%
추론·수학
GPQA Diamond
80%↓1%
HLE
19%↑3%
코딩
AA Coding Index
31%↓3%
TAU2
68%↓4%
TerminalBench
29%↓2%
SciCode
36%↓5%
언어·지시
IFBench
72%↑16%
AA-LCR
60%↓2%
출력 속도
일반 모드
80tok/s↑0
출력 시작 1.88s
추론 모드
163tok/s↑46
출력 시작 13.16s