久しぶりに新しい画像生成モデルがでました。
HiDreamというモデルで、性能違いの種類があってそれぞれ使ってみましたので、やり方などを紹介したいと思います。
HiDreamとは
HiDreamは2025年4月7日にHiDream.aiによってオープンソースで公開された画像生成モデルです。
パラメータ数は170億でFlux.1よりも多いです。
ライセンスは MITライセンスなので商業目的での使用が可能です。
テキストから画像生成するモデルとしてはいくつか種類があり、HiDream-l1-FullとHiDream-l1-DevとHiDream-l1-Fastがあります。
HiDream-E1-Fullというのもありますが、これはHiDream-I1-Full のカスタムバージョンで、プロンプトによる指示で画像を描き替える専用モデルになります。
ComfyUIでの実行
ComfyUIはGoogle Colaboratoryで実行しました。
テキストから画像生成する3つのHiDreamモデルの設定は以下がいいみたいです。
CFG Scale | Negative prompt | Steps | Sampler | Shift | |
---|---|---|---|---|---|
HiDream-l1-Full | 5.0 | 使える | 50 | uni_pc | 3.0 |
HiDream-l1-Dev | 1.0 | 使えない | 28 | euler | 6.0 |
HiDream-l1-Fast | 1.0 | 使えない | 16 | euler | 3.0 |
ネガティブプロンプトを使わない場合は、以下のようにConditioningZeroOutノードを使用しました。

CFG Scaleとステップ数と使用するサンプラーはKSamplerノードで設定できます。
シフトの値はModelSamplingSD3ノードを使用して設定します。

まずはハードウェアアクセラレータの設定をT4 GPUにしてやってみました。
生成したときのGPU RAMは13.8GBで、エラー無く実行できました。

しかし、生成にはHiDream-l1-Fastで515秒かかっていました。

HiDream-l1-Devでは890秒くらいかかっていました。

HiDream-l1-Fullは1時間近くもかかっていました。
時間がかかりすぎるのはGPU RAMが足りないせいかと思ってハードウェアアクセラレータをL4 GPUに変更してみました。
変更したら、以下のように使用されるGPU RAMが増加しました。

HiDream-l1-Fastは54秒くらいとかなり高速になりました。

HiDream-l1-Devも77秒くらいといい感じです。

HiDream-l1-Fullは242秒くらいと大幅に早くなっていました。

以下が生成したイラストになります。
リアルよりなイラストはいい感じでした。

アニメ調のイラストは、ちょっと微妙かなぁという感じでした。

そういえば、生成を実行してすぐに以下のエラーがでるときがありました。

CLIPTextEncodeノードで”Allocation on device”になっているみたいですが、エラーが発生してから特に変えずにもう一度実行すると、エラーがでずに実行できてしまいました。
原因は分かりませんでしたが、エラーになってももう一度実行すれば問題無いことがあることが分かったので、他のエラーがでたときもとりあえずもう一度実行してみるのもいいかもしれません。
まとめ
実写系はかなりいい感じでした。

コメント