Scribble at 2025-12-14 12:48:58 Last modified: 2025-12-14 13:18:59
FLUX.1 の画像生成は、そろそろ慣れてきた頃なのだけど(上記のとおり)、問題はやはり画像を生成するのに時間がかかるということだ。SDXL の Lightning や LCM サポートで STEP 4 とかで出してると、Hires.fix や ADetailer なしで出せば、壁紙サイズ(1920 x 1080 ピクセル)の画像でも2秒あれば出てくるのだけど、FLUX.1 Krea-dev だと1分はかかる。プロダクト・ユースで最終工程に使うならともかく、一般家庭でパソコンの壁紙などに使う解像度やサイズや描きこみなどの範囲では、あまりにも実用性に欠ける。まるで20年前の Photoshop でフィルターをかけるために、処理が終わるまでタバコを端まで吸っていたような頃の感覚がある。
ということで、先月の後半に Alibaba のチームがリリースした "Z-Image" の蒸留ヴァージョンである "Z-Image-Turbo" を試してみようかと思って ComfyUI に追加してみたのだった。Z-Image-Turbo は8ステップていどで高精細な画像を出せるという評判で、少しずつユーザが増えているようである。だが、僕がダウンロードしたベース・モデルは、"Z-Image-Turbo-AIO" という VAE やテキスト・エンコーダなどが同梱された特殊なモデルだからなのか、標準的なワークフローが全く動かないという妙なことになっている。そろそろ、出来合いのワークフローを使うだけじゃなくて、スクラッチでワークフローを組み立てられるだけの知識を身に着けておかないといけないな。
あーあと FLUX.1 使ってて困るのが、壁紙サイズだと1枚が 4 MB くらいになることだ。SDXL で JPEG 画像を出していれば、壁紙サイズでも 300 KB くらいだから、10倍のファイル・サイズになってしまう。これではストレージにすぐに無くなってしまう。なので、既に save image extension のノードを使っているのだけど、JPEG の品質を 100 % にすると、やはり依然として 2 MB くらいになってしまうのが困る。
・・・と、色々な文句を書いているけれど、やはり FLUX.1 のレベルになると物体の描画が正確になるので、確かにプロダクト・レベルに使えるモデルだなと思うのは確かだ。たとえば、SDXL だと建物の柱がたいてい歪んでいるけれど、FLUX.1 で描画した建物は、ちゃんと柱などが真っ直ぐに描写される。これは、とりわけ写実的な画像を生成するときには欠かせない品質だろうと思う。