엔비디아, 로봇 추론 속도 90% 높인 Fast-ThinkAct 공개
- •엔비디아 연구진이 로봇의 추론 지연 시간을 89.3% 단축한 새로운 프레임워크인 Fast-ThinkAct를 발표했다.
- •이 시스템은 느린 텍스트 기반 연쇄 사고(CoT) 방식을 효율적인 수학적 표현으로 대체하여 실시간 제어 능력을 극대화했다.
- •Fast-ThinkAct는 복잡한 장기 과제 수행과 오류 복구 능력에서 우수한 성능을 유지하며 물리적 AI 분야의 실용성을 높였다.
엔비디아 소속 치핀 황(Chi-Pin Huang) 연구원과 그의 팀은 인공지능이 제어하는 로봇의 사고 및 행동 속도를 획기적으로 개선한 'Fast-ThinkAct' 프레임워크를 선보였다. 기존의 시각 지능과 언어 모델을 결합하여 물리적 과제를 수행하는 방식은 처리 속도가 현저히 느려 실시간 로봇 제어에 한계가 있었다. 이러한 병목 현상은 모델이 행동을 결정하기 전, 단계별 논리적 근거를 인간의 언어인 텍스트로 일일이 생성하는 '연쇄 사고(Chain-of-Thought)' 과정을 거치기 때문에 발생한다. Fast-ThinkAct는 사고 과정을 텍스트가 아닌 압축된 수학적 공간 내에서 처리하는 '잠재 계획(Latent Planning)' 방식을 도입하여 이 문제를 근본적으로 해결했다.
연구팀은 지식이 풍부한 거대 '교사 모델'의 추론 능력을 작은 모델이 학습하도록 유도하는 지식 증류 기법을 적용했다. 이를 통해 복잡한 물리적 기동에 필요한 지능은 그대로 보존하면서도, 시간이 오래 걸리는 텍스트 생성 단계는 과감히 생략하는 효율적인 시스템을 구축했다. 이에 따라 AI가 정보를 인식하고 최종 의사결정을 내리기까지 걸리는 추론 지연 시간을 기존 방식 대비 89.3%나 단축하는 데 성공했다. 특히 역동적인 실제 환경에서 진행된 다양한 로봇 공학 벤치마크 테스트에서 그 성능을 입증하며 실시간 물리적 AI 구현의 가능성을 열었다.
또한 Fast-ThinkAct는 처리 속도가 빨라졌음에도 불구하고, 긴 시간 동안 여러 단계의 목표를 일관되게 추적해야 하는 장기 과제 수행 능력이 매우 우수하다는 특징이 있다. 실제로 이 프레임워크는 작업 수행 중 예기치 못한 실패가 발생하더라도 이를 스스로 인지하고 복구하는 강력한 회복 탄력성을 보여주었다. 더불어 적은 양의 데이터만으로도 새로운 환경과 작업에 빠르게 적응하는 일반화 성능을 갖추어 다양한 산업 현장에 즉각 투입이 가능하다. 이러한 기술적 성과는 로봇이 고도의 지능과 민첩한 반응 속도를 동시에 갖춰야 하는 '물리적 AI' 시대를 앞당기는 중요한 이정표가 될 것으로 평가받는다.
결과적으로 엔비디아 연구진은 추론의 효율성이 결코 문제 해결의 정밀도를 해치지 않는다는 사실을 입증하며 로봇 제어 기술의 새로운 표준을 제시했다. 또한 이번 연구는 자율 주행 로봇이나 정밀 제조 공정 등 실시간 반응이 필수적인 분야에서 인공지능의 활용 범위를 대폭 확장할 것으로 기대를 모으고 있다. 한편 연구진은 향후 더 복잡한 인간과의 상호작용이 필요한 서비스 로봇 분야로도 이 기술을 확대 적용할 계획이다. 이를 통해 물리적 환경과 정교하게 상호작용하는 지능형 시스템의 성능 한계를 다시 한번 뛰어넘을 것으로 전망된다.