HY-World 2.0:画像から没入型3D空間を生成
- •HY-World 2.0がテキストや単一画像から高精度な3Dシーンを生成。
- •ナビゲーション、世界拡張、インタラクティブな探索を可能にする専門モジュールを統合。
- •プロジェクトをオープンソース化し、3D世界モデルの広範な研究を促進。
静止画の生成から、歩き回れる3D環境の構築へと進化することは、人工知能における次の主要なフロンティアである。HY-World 2.0の登場により、研究チームはテキストプロンプトや一枚の写真から、高精細な3D風景を構築するフレームワークを公開した。単なるピクセル生成にとどまらず、空間の形状をデジタル建築家のように再構成するため、ゲームのステージを散策するかのような体験が可能となる。
この変換を支える技術の核は、3D Gaussian Splattingである。これは従来のポリゴンモデルとは異なり、3D空間上の色と密度を保持する浮遊する点の集合として表現される。学習可能な微細な要素を用いることで、極めて詳細かつリアルタイムレンダリングに適した効率的なシーン構築を実現した。HY-World 2.0は、パノラマ生成、軌道計画、世界拡張、最終構成という4段階のプロセスでこれを完結させている。
今回のリリースにおいて特筆すべきは、その汎用性の高さだ。テキストや単一画像だけでなく、マルチビュー写真や動画入力にも対応し、仮想空間を生成できる。専門的な3Dスキャン機器や高価なソフトを持たないユーザーにとっても、シネマティックな環境構築への扉が開かれた。記述的な指示だけで、誰しもが仮想世界の構築者になれる時代が到来したのである。
さらに、生成された空間を探索するための専用プラットフォーム「WorldLens」の導入も重要だ。単なる静止画の生成を超え、インタラクションやキャラクターの移動、衝突判定といった機能が実装されている。エンジンに依存しない設計であるため、特定のソフトウェア環境に縛られることなく、生成された世界を自由に探索できる。
モデルの重みと詳細な技術情報のオープンソース化は、学術機関やインディーズ開発者にとって大きな恩恵となる。現実世界の物理的性質を理解するWorld Model(世界モデル)の構築が加速する中で、透明性の高い基盤技術の存在は不可欠だ。HY-World 2.0は、デジタルエンターテインメントや建築の可視化、教育のあり方を一変させる合成現実の未来を指し示している。