Sakana AI、基盤モデルを日本仕様化する「Namazu」発表
- •Sakana AI、オープンウェイトモデルを各国仕様に最適化する事後学習技術を開発
- •日本仕様の試作モデル「Namazu」シリーズ3種と対話型AI「Sakana Chat」を公開
- •既存モデルの知能を維持しつつ、政治・歴史的質問への回答中立性と正確性を向上
東京を拠点とするAIスタートアップのSakana AIが、既存の世界最高水準のオープンウェイト基盤モデルを、日本独自の文化や価値観、さらには安全保障上の要件に適応させる「事後学習(post-training)」技術を開発しました。現在、大規模言語モデル(LLM)の事前学習には莫大な計算リソースが必要であり、最先端モデルの開発は米国や中国の巨大企業に集中する傾向にあります。しかし、学習済みのモデル内部データが公開される「オープンウェイト」の流れが加速しており、これらをいかに「日本仕様」へと昇華させるかが国内産業の課題となっていました。
今回発表された試作モデル「Namazu(α版)」シリーズは、この課題に対する強力な回答です。DeepSeek-V3.1やLlama-3.1-405Bといった、すでに世界トップクラスの知能を持つモデルをベースに、Sakana AI独自の技術で事後学習を施しました。特筆すべきは、モデルが元々持っている高度な推論能力やコーディング知識、数学的思考能力を一切損なうことなく、日本固有の文脈に適応させている点です。ベンチマークテストの結果、Namazuはベースモデルと同等の基礎能力を維持していることが証明されています。
さらに、政治や歴史、外交といった特定の地域のイデオロギーが反映されやすいテーマにおいて、回答の質が劇的に改善されました。従来の海外製モデルでは、特定の質問に対して過度な回答拒否やバイアスが見られることがありましたが、Namazuでは中立性と事実の正確性が大幅に向上。例えば、DeepSeekベースのモデルでは敏感な質問の約7割に回答を拒否していたところ、Namazu化によってその拒否率がほぼゼロになり、客観的事実に基づいた多角的な視点を提供できるようになりました。
Sakana AIはまた、このNamazuモデルを搭載したウェブ検索機能付きのチャットサービス「Sakana Chat」を一般公開しました。ユーザーはブラウザから、最新の情報を参照しながら対話する「日本仕様のAI」を体験できます。同社は今後、複数のモデルを最適に制御する技術や、特定の目的を遂行する「エージェント技術」を統合し、チャットの枠を超えた次世代のAIソリューションを展開する計画です。これは、海外の強力な知能を輸入しつつ、自国のアイデンティティを保つ「ソブリンAI」の新たなモデルケースとなるでしょう。