Wan 2.1をComfyUIで使ってテキストから動画生成してみました

Colab上で実行したComfyUIで動画生成モデルのWan 2.1を使ってみました。

Wan 2.1はさまざまなことができますが、とりあえずテキストから動画生成するやり方を紹介します。

目次

Wan 2.1とは

Wan2.1は、中国Alibaba製のオープンモデルです。

テキストから動画、画像から動画、動画編集、テキストから画像、動画から音声など、多様なタスクに対応しています。

ライセンスはApache 2.0です。

そのため商用利用が可能です。

ComfyUIでの実行

以下のサイトからモデルやComfyUIのワークフローをダウンロードできます。

URL:https://comfyanonymous.github.io/ComfyUI_examples/wan/

t2vのものをGoogle Colabで実行したComfyUIで使ってみました。

生成には365秒かかりました。

GPU RAMは最大のときで14.3GBになっていました。

動画の長さは、以下のEmptyHunyuanLatentVideoノードのlengthを変更すれば変えられます。

デフォルトでは33だったので、65に変更して生成してみました。

GPU RAMは瞬間的な最大値はあまり変わりませんでしたが、生成中の値は、33のときが11.1GBだったのに対して、12.6GBに増えていました。

生成にかかる時間は、1093秒くらいで、結構伸びました。

まとめ

簡単にハイクオリティな動画が生成できた気がします。

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次