AI 모델 비교

우리들의 비전

Gemini 3.1 Flash TTS Preview는 Google의 3.1 세대 음성 합성 모델로, 가격 대비 성능에 최적화된 저지연·고표현력 음성 생성에 특화되어 있습니다. 70개 이상의 언어를 지원하며, 200개 이상의 오디오 태그를 통해 어조, 속도, 감정 표현 등 음성 스타일을 텍스트 입력 내에서 세밀하게 제어할 수 있습니다. 네이티브 다중 화자 대화를 지원해 팟캐스트, 드라마틱 스크립트 등 복수 캐릭터 시나리오에서도 자연스러운 대화 흐름을 유지합니다. Artificial Analysis TTS 리더보드에서 Elo 1,211을 달성했으며, 모든 생성 오디오에 SynthID 워터마크가 내장되어 AI 생성 콘텐츠를 신뢰성 있게 식별할 수 있습니다.

제공사

Google

출시일

2026-04-16

학습완료일

—

라이선스

상용 모델

입출력 형식

처리용량

8K / 16K

API 입출력 (1M)

—

사용 방법

API 연결

출력 속도

—

Arena 종합

—

Intelligence Index

—

Coding Index

—

Math Index

—

LiveBench

—

ForecastBench

—

GPQA Diamond

—

HLE

—

MMLU-Pro

—

AIME 2025

—

MATH-500

—

LB 추론

—

LB 수학

—

LB 데이터 분석

—

LiveCodeBench

—

LB 코딩

—

LB 에이전틱

—

TAU2

—

TerminalBench

—

SciCode

—

IFBench

—

AA-LCR

—

환각률 (HHEM)

—

사실 일관성 (HHEM)

—

LB 언어

—

LB 지시

—

비용 계산하기 AI 모델 상세 페이지

1 / 3

좌우로 스와이프

제공사