OpenAI, 과학 연구 가속화할 'GPT-Rosalind' 공개
- •OpenAI는 생명공학 및 화학 연구 흐름을 획기적으로 개선하기 위해 설계된 거대언어모델 GPT-Rosalind를 발표했다.
- •해당 모델은 복잡한 RNA 서열-기능 분석 과제에서 인간 전문가의 95% 수준에 도달하는 성과를 보였다.
- •50개 이상의 과학 데이터베이스와 연동되는 새로운 플러그인을 통해 신약 개발과 실험 설계를 효율화한다.
인공지능이 이론적 연구 영역을 넘어 실제 실험실 현장에 도입되면서 과학적 발견의 방식이 근본적으로 변하고 있다. OpenAI가 이번에 선보인 GPT-Rosalind는 생명과학 분야를 겨냥한 특화된 추론 모델이다. 분자 생물학이나 유전체학의 미묘한 차이를 다루는 데 어려움을 겪는 일반 모델과 달리, 이 시스템은 신약 개발과 중개 의학에 필수적인 복잡한 다단계 업무를 수행하도록 최적화되었다.
대학생들이 주목할 핵심은 단순한 지능의 수준이 아니라 실제 현장에서의 활용도다. 기존 제약 연구는 초기 단계부터 규제 승인까지 10년 이상의 시간이 소요되기도 한다. GPT-Rosalind는 연구 문헌 분석을 자동화하고 산재된 실험 데이터를 통합하며 DNA 시약 설계를 돕는 등 현대 과학의 고질적인 병목 현상을 해결한다.
이 모델의 기술적 역량은 강력한 실증 데이터를 통해 입증되었다. 생명공학 기업 다이노 테라퓨틱스(Dyno Therapeutics)와의 협력을 통해 진행된 테스트에서, 모델은 RNA 서열-기능 분석 과제에서 인간 전문가 상위 95% 수준의 성적을 기록했다. 또한, Codex용 생명과학 연구 플러그인을 추가해 50개 이상의 공공 데이터베이스와 분석 도구를 직접 연결하는 가교 역할을 수행한다.
이번 발표는 소비자용 챗봇 인터페이스를 넘어 규제가 엄격하고 결과가 중요한 기업 환경으로 영역을 확장하려는 OpenAI의 전략적 진화를 보여준다. 앨런 인스티튜트(Allen Institute)와 암젠(Amgen) 같은 권위 있는 기관들과 협업하며, 연구 과정의 필수 인프라로 자리매김하겠다는 의도다. 이는 AI가 과학자를 대체하는 것이 아니라, 방대한 데이터 속에서 새로운 패턴을 찾아내 수년이 걸릴 시행착오를 단 몇 주 만에 끝낼 수 있는 강력한 동료가 되는 미래를 제시한다.