Scribble at 2026-01-19 06:59:03 Last modified: 2026-01-19 08:23:05

添付画像

Stable Diffusion 系列のモデルを動かすフロント・エンドとして使ってきた A1111 氏の Web UI だが、何度か説明しているように、開発が止まっていて今後も再開は期待できないため、他のフロント・エンドに乗り換えようと ComfyUI を使ってみていた。ただ、Web UI の操作性が ComfyUI よりもシンプルであるのは確かだし、ComfyUI では細かい制御ができるけれど、本当に正確に動かしたいなら、どう考えてもコマンドでやるべきなのだ。いわば、ComfyUI はハッカー志望の子供が大規模言語の研究者やエンジニアの真似事をする道具にすぎず、あれの使い方がうまくなったくらいで機械学習の何たるかが分かるわけではない。とにかく、あの RAD ツール的な玩具っぽさが、どうにもゼネコンで研修を受けてる新卒みたいな気分にさせられてウンザリしてしまうのだ。

そういうわけで、A1111 氏のツールからフォークした Forge 系列のツールでよさそうなものがないかと探していたところ、"Forge Neo" が新しいモデルにも対応していて良さそうだったため、入れてみた。結論としては、かなり良好だ。最新のモデルも簡単に導入できて、たとえば上に出している画像は、左が "NetaYume Lumina"、そして右が "Z-Image Turbo" という、どちらも昨年の後半に登場した最新の diffusion モデルで "scenary, landscape, mountain" というプロンプトだけで出してみた結果だ。

なお、この二つは単純に比較することはできない。NetaYume Lumina と比べて、Z-Image Turbo は16ビットのモデルなので、容量が 20 GB と NetaYume Lumina の倍くらいあるからだ。そして Z-Image Turbo は 20 GB のモデルであるから、僕のマシンの GPU がもつ 16 GB の RAM では処理できないため、画像を生成するときはスワップしている。それでも、NetaYume Lumina の半分くらいの時間で画像を生成している。マシンにかかる負担は大きいが、優秀だ。NetaYume Lumina や FLUX.1 と比較して Z-Image Turbo を推す人がいるのもうなずける。

あと余談だが、Forge Neo をインストールするときに Python も新しくした方がいいらしいことを忘れていて、そのままインストールしてしまったので、 Python 3.10.6 のままなのだが、これでもちゃんと動いている。ただ、推奨は Python 3.11 系統なので、A1111 氏の Web UI を手放せると判断したら、Python はアップデートしたい。それから設定の調整も必要だ。いま入れたばかりの状態だと、SDXL と比べて、1920 x 1080（壁紙）のサイズで出すのに、だいたい１枚で２分30秒くらいかかるからだ。これがパフォーマンスの限界であれば、実用性には乏しい。

冒頭に戻る