Kimi K2.5: 에이전트 스웜으로 진화한 멀티모달 AI
- •15조 개의 혼합 토큰으로 학습된 네이티브 멀티모달 모델 Kimi K2.5 출시
- •100개의 서브 에이전트를 병렬 운용하는 '에이전트 스웜' 패러다임으로 실행 속도 4.5배 향상
- •시각적 디버깅 및 비디오 기반 웹사이트 자동 재구축 등 최첨단 코딩 역량 증명
Kimi K2.5가 오픈소스 AI 분야에서 유의미한 도약을 이뤄냈다. 기존의 순차적인 처리 방식에서 탈피하여 고성능 ‘에이전트 스웜(Agent Swarm)’ 아키텍처로의 전환을 선언한 것이다.
15조 개의 토큰으로 학습된 네이티브 멀티모달 설계를 바탕으로 시각 정보와 텍스트를 하나의 통합된 데이터 스트림으로 처리한다.
이러한 시너지는 AI가 자신의 프런트엔드 결과물을 직접 보며 오류를 고치는 시각적 디버깅이나, 비디오 파일만으로 전체 웹사이트를 그대로 복원하는 수준 높은 기능을 가능하게 했다.
이번 혁신의 핵심 기술은 병렬 에이전트 강화 학습(PARL)이다. 복잡한 문제를 100개의 병렬 가능한 하위 작업으로 분해하도록 중앙 오케스트레이터를 훈련시킨 점이 돋보인다.
모델이 효율적인 병렬 처리를 생략하고 하나씩 처리하려는 경향을 방지하기 위해, 연구진은 ‘임계 단계(Critical Steps)’라는 지표를 도입했다.
가장 빠른 병렬 경로를 택하지 않을 경우 모델에 페널티를 부여하는 방식이다. 이 스웜 인텔리전스 덕분에 100페이지 분량의 문서 생성이나 복잡한 금융 모델링 같은 고밀도 업무를 단 몇 분 만에 완수할 수 있다.
Kimi K2.5는 개발자 워크플로우와의 긴밀한 통합도 놓치지 않았다. Kimi Code를 통해 외부 도구 및 데이터셋과 상호작용할 수 있는 모델 컨텍스트 프로토콜을 지원한다.
단순히 모델 크기를 키우는 대신 다수의 특화된 서브 에이전트로 확장하는 전략을 취함으로써, 오픈 웨이트(Open-weights) 프레임워크의 접근성을 유지하면서도 주요 폐쇄형 모델에 필적하는 강력한 성능을 구현해냈다.