구글, 실시간 음성 AI 'Gemini 3.1 Flash Live' 전격 공개
- •구글이 초저지연 음성 대화 모델 'Gemini 3.1 Flash Live'를 전 세계에 공개
- •음성 추론 벤치마크에서 GPT-4o를 상회하는 95.9%의 높은 정확도 기록
- •대화하며 정보를 검색하는 신기능 'Search Live'의 일본어판 서비스 개시
구글이 발표한 'Gemini 3.1 Flash Live'는 인간과 자연스러운 대화가 가능한 최신 실시간 음성 AI 모델이다. 기존 AI는 음성을 텍스트로 변환한 뒤 처리하는 과정을 거치느라 수초간의 지연이 발생할 수밖에 없었으나, 이 모델은 음성을 직접 처리하는 네이티브 설계를 통해 실제 대화에 가까운 놀라운 응답 속도를 구현했다.
성능 측면에서는 단순한 속도 향상을 넘어 복잡한 논리적 추론이 필요한 음성 대화에서도 압도적인 정밀도를 보여준다. 구글의 벤치마크 평가에 따르면, 음성 지시만으로 적절한 프로그램이나 기능을 호출하는 능력을 측정하는 'Function calling' 지표에서 기존 모델을 크게 웃도는 90.8%를 기록했다. 또한 문맥을 파악하는 고도의 이해력 테스트에서도 경쟁사의 최신 모델을 능가하는 결과를 남겼다. 이를 통해 사용자는 모호한 지시나 복잡한 질문에도 스트레스 없이 AI와 소통할 수 있게 되었다.
이러한 혁신적인 기술은 구글 검색의 새로운 형태인 'Search Live'의 기반으로 즉시 투입되었다. 기존의 검색이 검색창에 키워드를 입력하고 결과를 살펴보는 정적인 작업이었다면, Search Live는 AI와 실시간으로 대화하며 정보를 깊이 있게 탐색하는 경험으로 진화했다. 예를 들어 요리 레시피를 상담하며 재료 대체안을 찾거나, 여행 계획을 세울 때 대화를 통해 목적지의 특징을 좁혀 나가는 등 훨씬 직관적이고 개인화된 검색이 가능하다.
구글은 이번 발표와 함께 일본어판 소개 페이지를 공개하며 차세대 검색 경험을 제공하기 시작했다. 검색 엔진 시장의 압도적 점유율을 가진 구글이 AI 기반의 '보이스 퍼스트' 인터페이스로 본격적인 전환을 선언함에 따라, 향후 몇 년 안에 우리가 인터넷과 소통하고 정보를 얻는 방식 자체가 근본적으로 변화할 것으로 전망된다.