NVIDIA Nemotron 3 Super는 120B 파라미터 규모의 오픈 하이브리드 MoE 모델로, 복잡한 멀티 에이전트 애플리케이션에서 연산 효율성과 정확성을 극대화하기 위해 12B 파라미터만을 활성화합니다. 이 모델은 하이브리드 Mamba-Transformer 아키텍처를 기반으로 구축되었습니다.
추론
학습 완료일
2026-02-01
이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.
입력 형식 → 출력 형식
이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.
처리용량
262KIN1MOUT
한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.
출처:공식 문서
AI 성능 평가
종합
AA Intelligence Index
36%↓2%
추론·수학
GPQA Diamond
80%↓1%
HLE
19%↑3%
코딩
AA Coding Index
31%↓3%
TAU2
68%↓4%
TerminalBench
29%↓2%
SciCode
36%↓5%
언어·지시
IFBench
72%↑16%
AA-LCR
60%↓2%
출력 속도
일반 모드
80tok/s↑0
출력 시작 1.88s
추론 모드
163tok/s↑46
출력 시작 13.16s