구글 딥마인드, 고도화된 자동화를 위한 Gemini Robotics-ER 1.6 공개
- •Gemini Robotics-ER 1.6 출시, 로봇의 공간 추론 및 물리적 환경 탐색 능력 대폭 향상
- •보스턴 다이내믹스(Boston Dynamics)와 공동 개발한 계기판 판독 기능으로 아날로그 게이지 해석 가능
- •개발자는 Gemini API 및 Google AI Studio를 통해 해당 모델 활용 가능
추상적 추론과 물리적 상호작용 사이의 간극이 점차 좁혀지고 있다. 구글 딥마인드(Google DeepMind)는 Gemini Robotics-ER 1.6을 통해 인공지능이 개념을 이해하더라도 물리적 현실에서 이를 제대로 적용하지 못하는 이른바 '구현 격차(Embodiment gap)' 문제를 해결하는 데 집중했다. 이번 업데이트는 단순한 디지털 처리를 넘어 공간 논리와 환경 인식 기능을 강화하여, 로봇이 인간과 같은 정밀함으로 작업할 수 있도록 설계되었다.
공간 논리란 인공지능이 물리적 제약 조건에 대한 가상 지도를 유지하는 능력을 의미한다. 로봇은 단순히 계기판을 식별하는 것을 넘어, 깊이와 각도, 그리고 시야를 가리는 장애물까지 고려해야 한다. 이 모델은 다각도 이해(multi-view understanding) 방식을 도입해 여러 시점에서 데이터를 합성함으로써 작업 공간을 입체적으로 표현한다. 이는 물류 창고나 제조 현장처럼 복잡하고 변화가 잦은 환경에서 자율 주행 로봇에게 필수적인 진화다.
무엇보다 보스턴 다이내믹스(Boston Dynamics, 로봇 공학 기업)와 협력하여 구현한 계기판 판독 기능이 인상적이다. 인간에게는 당연해 보이는 아날로그 게이지 수치 확인도 로봇에게는 텍스트 식별, 바늘 위치 파악, 조명 변화 인식 등 복합적인 기술이 요구된다. 이는 단순히 흥미로운 기능에 그치지 않고, 디지털 연결이 고려되지 않은 기존 산업 시설의 설비를 현대적인 지능형 시스템으로 개선하는 핵심 기술이 될 전망이다.
이번 모델의 핵심 가치는 안전성이다. 구글 딥마인드는 Gemini Robotics-ER 1.6이 자사의 로봇 모델 중 가장 안전하며, 특히 공간 추론 능력에 중점을 둔 고강도의 Adversarial Testing을 거쳤다고 밝혔다. 그 결과, 로봇은 예측 불가능한 상황이나 시스템을 교란하려는 의도적인 공격 시도 속에서도 경로를 이탈하거나 움직임을 잘못 계산할 가능성이 대폭 낮아졌다.
결과적으로 이번 출시를 통해 로봇 공학의 흐름은 변화하고 있다. 사전에 프로그래밍된 딱딱한 기계적 동작에서 벗어나, 새로운 도구와 예기치 못한 주변 상황에 유연하게 적응하는 에이전트로 나아가는 중이다. 표준 API를 통해 누구나 이러한 모델에 접근할 수 있게 됨에 따라 물리적 지능형 하드웨어를 구축하는 진입 장벽이 낮아졌으며, 이는 물류부터 가사 도우미까지 다양한 분야에서 혁신의 물결을 일으킬 것으로 보인다.