Gemini 3.1 Flash TTS Preview는 Google의 3.1 세대 음성 합성 모델로, 가격 대비 성능에 최적화된 저지연·고표현력 음성 생성에 특화되어 있습니다. 70개 이상의 언어를 지원하며, 200개 이상의 오디오 태그를 통해 어조, 속도, 감정 표현 등 음성 스타일을 텍스트 입력 내에서 세밀하게 제어할 수 있습니다. 네이티브 다중 화자 대화를 지원해 팟캐스트, 드라마틱 스크립트 등 복수 캐릭터 시나리오에서도 자연스러운 대화 흐름을 유지합니다. Artificial Analysis TTS 리더보드에서 Elo 1,211을 달성했으며, 모든 생성 오디오에 SynthID 워터마크가 내장되어 AI 생성 콘텐츠를 신뢰성 있게 식별할 수 있습니다.
Gemini 3.1 Flash TTS Preview는 Google의 3.1 세대 음성 합성 모델로, 가격 대비 성능에 최적화된 저지연·고표현력 음성 생성에 특화되어 있습니다. 70개 이상의 언어를 지원하며, 200개 이상의 오디오 태그를 통해 어조, 속도, 감정 표현 등 음성 스타일을 텍스트 입력 내에서 세밀하게 제어할 수 있습니다. 네이티브 다중 화자 대화를 지원해 팟캐스트, 드라마틱 스크립트 등 복수 캐릭터 시나리오에서도 자연스러운 대화 흐름을 유지합니다. Artificial Analysis TTS 리더보드에서 Elo 1,211을 달성했으며, 모든 생성 오디오에 SynthID 워터마크가 내장되어 AI 생성 콘텐츠를 신뢰성 있게 식별할 수 있습니다.