最近、miHoYoの創設チームによる新しいAIモデルの発表に関するニュースに関心が集まっています。今月初めに「Anuttacon」という名前で、LPM 1.0が公開されました。これはリアルタイムのビデオキャラクター生成技術で、非常に興味深いものです。



見たところ、このモデルはビデオ・オーディオの完全な会話をサポートし、話す、歌う、聞く、リアクションを同時に行うことができ、スムーズに動作します。特に注目すべきは、口の動き、表情、身体の動きなどの詳細なリアルさで、より自然に見える点です。

技術的には、LPM 1.0は17Bのパラメータを使用し、低遅延のストリーミングバージョンに調整されています。もう一つの興味深い点は、多様なキャラクタースタイルに対応していることで、リアルな外観、2Dアニメーション、3Dゲーム、さらには非人間の生き物まで、追加の調整なしで対応可能です。チームはまた、キャラクターのパフォーマンスを評価するための標準であるLPM-Benchも公開しています。

競合モデルと比較して、従来の制約、例えば30秒までしか生成できないという制限は撤廃されました。LPM 1.0は無制限の出力時間をサポートし、ゲーム内のNPC会話やバーチャルライブ配信に適しています。

注目すべきは、Anuttaconがこの発表を学術交流と明確に位置付けており、現時点ではAPIや一般向けの製品提供は予定されていないことです。しかし、コミュニティはこれをAI人材の誘引と見なしています。

実際、これはmiHoYoの蔡昊宇(Tsai Haoyu)がAI開発において一歩前進したものであり、以前からAIツールやチャットボットの研究に取り組んできたことを踏まえると、ゲームエンジンやインテリジェントNPC向けのAI開発の方向性が新たな段階に入ったことを示しています。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン