画像から動画生成できるモデルのLTXVをComfyUIで使ってサムネのイラストから動画を生成してみたのでそのやり方を紹介します

2025年1月5日2025年5月14日

ComfyUIで動画生成AIであるLTXVを試してみたので、そのときのことを解説します。

実行したときに発生したエラーの対処と、参考になるように生成した動画も紹介します。

＼生成AIにおすすめPC／

mouse 【 RTX4060搭載/3年保証】クリエイターノートPC DAIV R6 (Core i7-13650HX RTX4060 32GBメモリ 1TB SSD Windows 11 16インチ WQXGA 動画編集 CAD)

¥269,800 （2025/05/31 22:58時点 | Amazon調べ）

Amazon

楽天市場

ポチップ

＼操作性抜群のおすすめマウス／

【SALE】ロジクール MX MASTER 3S アドバンスドワイヤレスマウス MX2300GRda Logi Bolt Bluetooth Unifying非対応静音無線 windows mac iPad Chrome 国内正規品 1年間無償保証

ロジクール公式ストア

¥16,050 （2025/06/03 10:25時点 | 楽天市場調べ）

Amazon

楽天市場

ポチップ

LTXVとは

ライトリックス（Lightricks）によって開発されたリアルタイムAIビデオ生成モデルであり、特に高品質な動画を迅速に生成する能力が注目されています。

このモデルは、768×512の解像度で24FPSの動画を生成し、その速度は視聴するよりも速いという特性があります。

ComfyUIでの実行

ライトリックスのGithubからダウンロードできるWorkflowをとりあえず使用しました。

エラーが発生

ComfyUIで実行したときに以下のエラー画面がでました。

エラーの文章は以下になります。

“Allocation on device”

調べたら、メモリが足りなくなるいわゆるOut of Memory(OOM)になっているということでした。

そのため、google ColaboratoryのランタイムのタイプでハードウェアアクセラレータをT4 GPUからL4 GPUに変更しました。

これで、GPU RAMは22.5GBまで使用できるようになります。

この状態で実行したら、GPU RAMは15.7GB使用していました。

ちなみに、ハードウェアアクセラレータをL4 GPUにしたときの1時間で消費するコンピューティングユニットは約2.4でした。

ダウンロードしたWorkflowからの変更点

RandomNoiseというノードの二つ目のパラメータのocntrol_after_generateの値がfixedになっていると、毎回同じものが生成されてしまうので、ここをrandomizeに変更しました。

生成にかかる時間

SamplerCustomAdvancedノードで1分くらいかかっています。Mochi 1で1時間近くかかっていたことを考えると、圧倒的に早いです。ただ、GPU RAMは15GBを超えてしまうので、注意が必要です。

生成される動画に関連するパラメータについて

以下の画像のLTXV Model Configuratorノードのパラメータを変更することで、動画の長さを長くしたり、より大きな動きがある動画にしたりすることができます。

frames_numberの値を大きくすることで動画の長さが長くなります。

frame_rateの値を大きくすることで、動きが滑らかになる気がします。

img_compressionの値は、細かい動きが良くなる気がします。値を増やすときは、42くらいまでにした方がいい気がします。それより大きくすると、ノイズが多くなって元の絵がかなりくずれてしまう感じがします。動きがあまりない動画の場合は、29くらいでいい気がします。

これらのパラメータは、いずれも値を大きくするとGPUの使用率が上がるので、メモリが溢れてしまうOOMに注意してください。

生成した動画

生成した動画と、入力した画像をサムネに使っている記事を紹介します。

その1

入力したサムネ画像を使用している記事

Hugging Faceのモデルで商用利用に注意が必要な動画生成AIモデルについて紹介します ComfyUIで動画生成AIをやってみようと思って調べ始めたら、思いのほかライセンスが特殊だったので、Hugging Faceからダウンロードできるモデルで調べたものについて解説します。

その2

入力したサムネ画像を使用している記事

サムネ用の画像をComfyUIで生成したときのプロンプトを紹介します画像生成AIで画像生成するときは入力として入れる文章、いわゆるプロンプトが重要になります。この記事では、このブログで使用しているサムネを生成したときのプロンプトを紹介します。

その3

入力したサムネ画像を使用している記事

ディープラーニング実装に関するエンジニア向け資格試験、E資格について受験に必要な条件や難易度・勉強… G検定を運営する日本ディープラーニング協会(JDLA)が実施するもう一つの資格試験であるE資格について、受験資格、メリットやデメリット、勉強方法について紹介します。

その4

入力したサムネ画像を使用している記事

ComfyUIで使用できて商用利用もできる動画生成AIモデルであるMochi 1での動画生成のやり方を紹介します ComfyUIで動画生成AIであるMochi 1を試してみたので、そのときのことを解説します。Mochi 1は商用利用できるモデルのため、参考になるように生成した動画も紹介します。

その5

入力したサムネ画像を使用している記事

データサイエンティスト協会が実施するDS検定★についてメリット・デメリットや難易度・勉強方法を紹介し… データサイエンティスト協会が実施するデータサイエンティスト検定リテラシーレベル（略称：DS検定★）について、メリットやデメリット、難易度や勉強方法について紹介します。

その6

入力したサムネ画像を使用している記事

IT勉強会プラットフォームconnpassのオススメAI系コミュニティを紹介します cnnpassは気軽にIT系の勉強会を開催できて誰でもそれに気軽に参加できるプラットフォームです。この記事ではAI系でオンラインで参加することができる勉強会や企業が開催するイベントを紹介します。

その7

入力したサムネ画像を使用している記事

ComfyUIに関する書籍がまだないので参考になりそうな別の書籍を紹介する ComfyUIはまだできたばかりのものなので、まだ解説する書籍が存在しません。なので、別のStable DiffusionのWebUIの解説書籍などで、参考になりそうなものを紹介します。

その8

入力したサムネ画像を使用している記事

生成した画像を商用利用できるオススメのCivitaiのFluxモデルを紹介します画像生成AIのモデルには商用利用を禁止しているものもあります。この記事ではComfyUIなどのWebUIで使用できるモデルをダウンロードできるサイトであるCivitaiにあるモデルで、商用利用できるFluxモデルを紹介します。

その9

入力したサムネ画像を使用している記事

ComfyUIがアップデートでUIがかなり変わって使い方が分からなかった話久しぶりにComfyUIを起動したら何かUIがめちゃくちゃ変わってて困ってしまいました。いろいろ操作したりして分かったことを解説したいと思います。まだわからないこともたくさんあると思うので、分かり次第追記していきたいと思います。

その10

入力したサムネ画像を使用している記事

クラウドで画像生成AIやってるとパソコンのスペック関係ないけど使ってるノートパソコンを紹介する(つい… Google ColaboratoryでComfyUIをやっていると正直使うPCは関係ないですが、自分が使っているノートPCを紹介します。使っていると言いつつも、もう売ってなかったので、同じシリーズのモデルを紹介します。ついでにGPUの設定についても解説します。

その11

入力したサムネ画像を使用している記事

「(エレコム)ゲーム用ボイスチャットミキサー(HSAD-GMMA10BK)」ガジェットレビュー本来の用途とはちょっと違うけど、パソコンやスマホの音声とゲーム機の音声を一つの有線ヘッドフォンで聞くのに便利です。スマートフォンで通話しながら、ゲームの音をミックスして同時に再生できるゲーミングミキサーです。