알리바바, 이미지 편집 속도 2배 높인 ADE-CoT 공개
- •알리바바 연구진이 작업 난이도에 따라 컴퓨팅 자원을 동적으로 할당하는 새로운 ADE-CoT 프레임워크를 선보였다.
- •이 시스템은 시각적 품질을 유지하면서도 표준 샘플링 방식 대비 2배 이상의 속도 향상을 구현했다.
- •최적의 편집 결과가 확인되면 프로세스를 즉시 종료하는 기회주의적 중단 메커니즘을 적용해 효율성을 높였다.
알리바바(Alibaba) 연구진이 AI 기반 이미지 편집을 더욱 빠르고 정밀하게 수행할 수 있는 새로운 프레임워크인 ADE-CoT를 발표했다. 최근 생성 과정에서 모델에 더 많은 처리 시간을 부여하는 테스트 시간 확장이 비약적으로 발전하며 텍스트-이미지 생성 품질을 높였지만, 이를 편집 작업에 적용하는 데에는 효율성 문제가 뒤따랐다. 단순히 이미지를 새로 생성하는 것과 달리, 편집은 원본 사진을 유지하면서 사용자의 구체적인 지시를 반영해야 하는 목적 지향적인 과정이기 때문이다.
ADE-CoT는 이러한 한계를 극복하기 위해 작업 난이도를 스스로 인식하는 시스템을 도입했다. 모든 요청에 동일한 연산량을 소모하는 대신, 모델이 편집의 복잡도를 사전에 추정하여 그에 맞는 연산 예산을 할당하는 방식이다. 이에 따라 간단한 작업에 불필요한 에너지를 낭비하지 않으면서도, 정교한 작업에는 필요한 만큼의 연산력을 집중할 수 있게 되었다.
또한 이 프레임워크는 영리한 조기 가지치기 메커니즘을 갖추고 있다. AI가 영역 국소화와 일관성 검사를 활용해 품질이 낮은 후보 이미지를 빠르게 식별하고 제외함으로써 불필요한 시간 소모를 방지한다. 무엇보다 시스템이 사용자의 의도에 완벽히 부합하는 결과를 찾아내면, 기회주의적 중단을 통해 작업을 즉시 마무리하는 효율성을 보여준다.
실제 다양한 최신 모델을 대상으로 한 테스트 결과, ADE-CoT는 Best-of-N 샘플링과 같은 기존 표준 방식보다 2배 이상 빠른 속도를 기록하면서도 월등한 결과물을 도출했다. 이러한 기술적 진보는 향후 고성능 AI 편집 도구가 더욱 강력한 성능을 갖추는 동시에, 사용자들에게 훨씬 더 기민한 반응성을 제공할 수 있음을 시사한다.