OpenProtein, 누구나 활용 가능한 AI 단백질 설계 시대 연다
- •OpenProtein.AI가 단백질 설계와 분자 연구를 위한 노코드(no-code) 생성형 AI 플랫폼을 공개했다.
- •새로운 모델 PoET-2는 적은 데이터와 컴퓨팅 자원으로도 탁월한 성능을 발휘한다.
- •글로벌 제약사 베링거인겔하임이 신약 개발 워크플로우에 이 플랫폼을 도입하며 협력을 확대한다.
생물학과 컴퓨터 과학의 접점에서 연구하는 학생들에게 그간 진입 장벽은 매우 높았다. 생명 활동의 핵심인 단백질을 설계하려면 생물학적 지식과 기계학습에 대한 깊은 전문성이 모두 요구되기 때문이다. OpenProtein.AI는 코딩을 모르는 생물학자도 고급 파운데이션 모델을 직접 활용할 수 있도록 노코드 인터페이스를 제공하여 이러한 장벽을 허물고 있다. 이를 통해 연구진은 복잡한 알고리즘을 손쉽게 다루며 암 치료제부터 염증성 질환 관리까지 신약 개발의 전 과정을 가속화할 수 있게 되었다.
이번 혁신의 핵심은 '단백질 언어 모델'에 있다. 거대언어모델(LLM)이 인간의 언어 패턴을 학습해 문장의 다음 단어를 예측하는 것과 마찬가지로, 단백질 언어 모델은 생물학적 서열의 문법을 학습한다. 이 모델들은 방대한 진화 데이터를 분석하여 아미노산 사슬이 특정 구조로 접히는 방식을 예측한다. 덕분에 연구자들은 시행착오를 반복하는 힘든 실험 과정 없이도 설계가 가능해졌다. 트리스탄 베플러(Tristan Bepler) MIT 연구원은 이 플랫폼이 기계학습을 모든 단백질 기능 연구에 자유롭게 적용할 수 있도록 설계된 개방형 도구 상자라고 설명한다.
플랫폼의 핵심 모델인 PoET-2는 이 분야의 빠른 성숙도를 입증한다. 기존 모델들은 거대한 컴퓨팅 자원을 필요로 했던 반면, PoET-2는 훨씬 적은 데이터와 에너지만으로도 이전보다 뛰어난 성능을 보인다. 이러한 효율성은 자원이 제한적인 학계와 중소 바이오 기업에 매우 중요하다. 이전까지 소수 거대 연구소의 전유물이었던 고성능 AI에 대한 접근성을 대폭 높였기 때문이다. 나아가 이들은 단순한 단백질 결합 예측을 넘어, 여러 생물학적 메커니즘에 동시에 작용하는 동적 설계 연구를 목표로 한다.
업계의 반응 또한 즉각적이다. 글로벌 제약사 베링거인겔하임은 이미 자사의 연구 파이프라인에 해당 플랫폼을 통합하여 복잡한 치료법 개발 주기를 단축하고 있다. 이러한 협업은 AI를 중심으로 개방형 생태계를 구축해야 한다는 최근의 흐름을 잘 보여준다. 공동 창업자인 팀 루(Tim Lu)는 AI 자원이 소수의 기업에 독점될 경우 발생하는 위험을 지적하며, 개방된 플랫폼을 통해 누구나 생물학적 발견의 도구를 누려야 한다고 강조했다.