Scribble at 2025-12-19 08:29:46 Last modified: 2025-12-20 10:40:24
Black Forest Labsが画像生成AI「FLUX.2 [max]」をリリースしました。FLUX.2 [max]は低コストながらOpenAIのGPT Image 1.5やGoogleのNano Banana Proに近い性能を発揮します。
11月から画像生成 AI の新しいモデルが続々とリリースされている。それらのオープン・ウェイト・モデルは HuggingFace で公開されており、既に ComfyUI のようなフロントエンドしか想定していないように思う。したがって、これから画像生成 AI をローカル・マシンで使うということなら、もう Stable Diffusion Web UI とか、それの派生プロジェクトとして開発がたいてい安定せず継続もしていないツールを選ぶのはやめて、ひとまずは ComfyUI をデファクト・スタンダードなフロントエンドとして選ぶのが妥当なのだろう。僕も、長らく使ってきて扱いやすいからとは言っても、そろそろ Stable Diffusion Web UI だけでは限界を感じている。それに、初心者向けに解説するコンテンツを何か書こうと思っても、既に開発が止まって何年にもなるフロントエンドを勧めるわけにはいかないし、それを使う前提で記事を書くのも不親切だ。
ということで、僕もそろそろ ComfyUI をメインのフロントエンドとして使うよう、来年にかけて移行するつもりだ。いまだに Stable Diffusion Web UI ベースで画像生成 AI を語っているというのも、一種の老害になる可能性もある。
ただ、そうは言っても最近のモデルはあまりにも巨大なので、FP8 ていどに量子化されるのを待たないと実際にはローカル・マシンで動かせない。上の FLUX.2 にしても、いくらオープン・ウェイト・モデルもリリースされたからといって、量子化されていないモデルだと 64 GB くらいあるので、こんなの200万円くらいで組むハイ・パワーなパソコンですら動かせない(RTX PRO 5000 でも VRAM は 48 GB だ・・・ったが、72 GB のモデルが出たようだ。まぁでも、普通の個人が買うようなものではないな)。