企查查アプリによると、最近、アリババ(中国)有限公司が「動画生成方法、動画生成モデルの訓練方法およびタスクプラットフォーム」の特許出願を公開しました。 特許の要約によると、本明細書の実施例は、動画生成方法、動画生成モデルの訓練方法およびタスクプラットフォームを提供します。これにおいて、動画生成方法は以下を含む:参考画像と参考音声を取得すること。ここで、前記参考画像は少なくとも参考対象の視覚情報を含む;前記参考画像中の視覚情報に基づき、参考対象の視覚特徴を抽出し、また、前記参考音声に基づき音声特徴を抽出すること;前記視覚特徴と前記音声特徴の相互作用特性に基づき、前記音声特徴の影響下での対象物の参考動作情報を予測すること。ここで、前記対象物は前記参考対象に基づいて得られる;前記参考動作情報と前記参考音声に基づき、前記対象物に対応する動画を生成すること。この方法を利用することで、動画中の対象物の視覚情報と対応する音声の一致度を向上させ、それにより動画の表現効果を高めることができます。
アリババが動画生成モデルのトレーニングに関する特許を公開
企查查アプリによると、最近、アリババ(中国)有限公司が「動画生成方法、動画生成モデルの訓練方法およびタスクプラットフォーム」の特許出願を公開しました。
特許の要約によると、本明細書の実施例は、動画生成方法、動画生成モデルの訓練方法およびタスクプラットフォームを提供します。これにおいて、動画生成方法は以下を含む:参考画像と参考音声を取得すること。ここで、前記参考画像は少なくとも参考対象の視覚情報を含む;前記参考画像中の視覚情報に基づき、参考対象の視覚特徴を抽出し、また、前記参考音声に基づき音声特徴を抽出すること;前記視覚特徴と前記音声特徴の相互作用特性に基づき、前記音声特徴の影響下での対象物の参考動作情報を予測すること。ここで、前記対象物は前記参考対象に基づいて得られる;前記参考動作情報と前記参考音声に基づき、前記対象物に対応する動画を生成すること。この方法を利用することで、動画中の対象物の視覚情報と対応する音声の一致度を向上させ、それにより動画の表現効果を高めることができます。