이 기사의 핵심 내용은?

Sakana AI, 오픈 웨이트 모델을 국가별 사양에 최적화하는 사후 학습 기술 개발 일본 사양 시제품 모델 'Namazu' 시리즈 3종 및 대화형 AI 'Sakana Chat' 공개 기존 모델의 지능을 유지하면서 정치·역사적 질문에 대한 답변 중립성 및 정확도 향상

Sakana AI, 일본 사양 최적화 모델 ‘Namazu’ 발표

•Sakana AI, 오픈 웨이트 모델을 국가별 사양에 최적화하는 사후 학습 기술 개발
•일본 사양 시제품 모델 'Namazu' 시리즈 3종 및 대화형 AI 'Sakana Chat' 공개
•기존 모델의 지능을 유지하면서 정치·역사적 질문에 대한 답변 중립성 및 정확도 향상

도쿄에 거점을 둔 AI 스타트업 Sakana AI가 기존의 세계 최고 수준 오픈 웨이트 모델을 일본 고유의 문화와 가치관, 나아가 안보 요구사항에 맞게 조정하는 사후 학습 기술을 개발했다. 현재 대규모 언어 모델(LLM)의 사전 학습에는 막대한 컴퓨팅 리소스가 필요해 최첨단 모델 개발이 미국과 중국의 거대 기업에 집중되는 경향이 있다. 하지만 학습된 모델의 내부 데이터가 공개되는 오픈 웨이트 흐름이 가속화됨에 따라, 이를 어떻게 일본 사양으로 승화시킬지가 일본 국내 산업의 핵심 과제로 부상했다.

이번에 발표된 시제품 모델 'Namazu(알파 버전)' 시리즈는 이러한 과제에 대한 강력한 해답이다. DeepSeek-V3.1이나 Llama-3.1-405B와 같이 이미 세계 정상급 지능을 보유한 모델을 기반으로, Sakana AI만의 독자적인 기술로 사후 학습을 거쳤다. 특히 모델이 본래 가진 고도의 추론 능력이나 코딩 지식, 수학적 사고 능력을 전혀 손상하지 않으면서도 일본 특유의 맥락에 적응시켰다는 점이 주목할 만하다. 벤치마크 테스트 결과, Namazu는 베이스 모델과 동등한 기초 능력을 유지하고 있음이 증명되었다.

특히 정치나 역사, 외교와 같이 특정 지역의 이데올로기가 반영되기 쉬운 주제에서 답변의 품질이 획기적으로 개선되었다. 기존 해외 모델은 특정 질문에 대해 과도하게 답변을 거부하거나 편향된 모습을 보이기도 했으나, Namazu는 중립성과 사실 정확성을 대폭 향상했다. 실제로 DeepSeek 기반 모델은 민감한 질문의 약 70%에 대해 답변을 거부했으나, Namazu 기술 적용 후 거부율이 거의 제로에 수렴하며 객관적 사실에 기반한 다각적인 시각을 제공할 수 있게 되었다.

Sakana AI는 또한 Namazu 모델을 탑재하고 웹 검색 기능을 갖춘 채팅 서비스 'Sakana Chat'을 일반에 공개했다. 사용자는 브라우저를 통해 최신 정보를 참조하며 대화하는 '일본 사양의 AI'를 직접 체험해 볼 수 있다. 향후 회사는 여러 모델을 최적으로 제어하는 기술과 특정 목적을 수행하는 에이전트 기술을 통합하여, 단순한 채팅을 넘어선 차세대 AI 솔루션을 전개할 계획이다. 이는 해외의 강력한 지능을 수입하면서도 자국의 정체성을 지키는 '소버린 AI'의 새로운 모델 케이스가 될 것으로 보인다.

도쿄에 거점을 둔 AI 스타트업 Sakana AI가 기존의 세계 최고 수준 오픈 웨이트 모델을 일본 고유의 문화와 가치관, 나아가 안보 요구사항에 맞게 조정하는 사후 학습 기술을 개발했다. 현재 대규모 언어 모델(LLM)의 사전 학습에는 막대한 컴퓨팅 리소스가 필요해 최첨단 모델 개발이 미국과 중국의 거대 기업에 집중되는 경향이 있다. 하지만 학습된 모델의 내부 데이터가 공개되는 오픈 웨이트 흐름이 가속화됨에 따라, 이를 어떻게 일본 사양으로 승화시킬지가 일본 국내 산업의 핵심 과제로 부상했다.

이번에 발표된 시제품 모델 'Namazu(알파 버전)' 시리즈는 이러한 과제에 대한 강력한 해답이다. DeepSeek-V3.1이나 Llama-3.1-405B와 같이 이미 세계 정상급 지능을 보유한 모델을 기반으로, Sakana AI만의 독자적인 기술로 사후 학습을 거쳤다. 특히 모델이 본래 가진 고도의 추론 능력이나 코딩 지식, 수학적 사고 능력을 전혀 손상하지 않으면서도 일본 특유의 맥락에 적응시켰다는 점이 주목할 만하다. 벤치마크 테스트 결과, Namazu는 베이스 모델과 동등한 기초 능력을 유지하고 있음이 증명되었다.

특히 정치나 역사, 외교와 같이 특정 지역의 이데올로기가 반영되기 쉬운 주제에서 답변의 품질이 획기적으로 개선되었다. 기존 해외 모델은 특정 질문에 대해 과도하게 답변을 거부하거나 편향된 모습을 보이기도 했으나, Namazu는 중립성과 사실 정확성을 대폭 향상했다. 실제로 DeepSeek 기반 모델은 민감한 질문의 약 70%에 대해 답변을 거부했으나, Namazu 기술 적용 후 거부율이 거의 제로에 수렴하며 객관적 사실에 기반한 다각적인 시각을 제공할 수 있게 되었다.

Sakana AI는 또한 Namazu 모델을 탑재하고 웹 검색 기능을 갖춘 채팅 서비스 'Sakana Chat'을 일반에 공개했다. 사용자는 브라우저를 통해 최신 정보를 참조하며 대화하는 '일본 사양의 AI'를 직접 체험해 볼 수 있다. 향후 회사는 여러 모델을 최적으로 제어하는 기술과 특정 목적을 수행하는 에이전트 기술을 통합하여, 단순한 채팅을 넘어선 차세대 AI 솔루션을 전개할 계획이다. 이는 해외의 강력한 지능을 수입하면서도 자국의 정체성을 지키는 '소버린 AI'의 새로운 모델 케이스가 될 것으로 보인다.

Sakana AI, 일본 사양 최적화 모델 ‘Namazu’ 발표

태그