OpenProtein、AIによるタンパク質設計を全生物学者の手に
- •OpenProtein.AIが生成AIを活用したノーコードのタンパク質設計・分子研究プラットフォームを公開
- •最新モデル「PoET-2」が計算リソースと実験データを削減しつつ、従来を上回る性能を実現
- •製薬大手ベーリンガーインゲルハイムが提携を拡大し、創薬ワークフローに導入
生物学とコンピュータ科学の境界領域を専門とする学生にとって、この分野への参入障壁は長らく非常に高いものだった。生物学的機能を司る微細な機械であるタンパク質の設計には、実験科学と機械学習の両面における深い専門知識が不可欠である。OpenProtein.AIは、プログラミングの知識がない生物学者でも高度な基盤モデルを利用できるノーコードインターフェースを提供し、この障壁を根本から取り払おうとしている。
複雑なアルゴリズムと研究者の間を橋渡しすることで、同社は癌治療から炎症性疾患の管理に至るまで、次世代の治療法開発を加速させている。この革新の核心にあるのが「タンパク質言語モデル」だ。大規模言語モデル(LLM)が人間のテキストのパターンから文章の続きを予測するように、タンパク質言語モデルは生物学的配列の「文法」を学習する。
膨大な進化データを分析することで、モデルはアミノ酸鎖が特定の構造へと折り畳まれる過程を予測できる。これにより、研究者は試行錯誤を繰り返す膨大な実験作業をスキップできるようになった。MITで生成モデルの先駆けとなったトリスタン・ベプラー(Tristan Bepler)は、このプラットフォームがユーザーの自由な発想を支援するオープンなツールボックスとして設計されていると強調する。
同プラットフォームの主力製品であるPoET-2は、この分野の急速な成熟を象徴している。以前は膨大な計算リソースを必要としたモデルとは異なり、PoET-2は、わずかなデータとエネルギーで以前のモデルを凌駕する性能を叩き出した。この効率性は、学術機関や中小バイオ企業にとって極めて重要であり、これまで大資本を持つ研究所の独占物であった最先端AIへのアクセスを民主化するものである。
業界の反応は迅速だった。世界的な製薬大手であるベーリンガーインゲルハイムは、すでにこれらのツールを研究パイプラインに統合しており、複雑な治療法の開発サイクルを大幅に短縮することを目指している。この提携は、AIを巡るオープンなエコシステムを構築する必要性という広範なトレンドを浮き彫りにしている。
共同創業者の一人であるティム・ル(Tim Lu)が指摘するように、AIのリソースが特定企業に独占されるリスクは軽視できない。OpenProteinのチームは、誰もが利用できるノーコードのプラットフォームを提供することで、未来の科学的発見に必要なツールを一部の専門家の手に閉じ込めることなく、より広範な科学コミュニティへと開かれたものにしている。