Scribble at 2025-07-28 22:04:04 Last modified: unmodified

添付画像

いろいろとモデルを見ていくと、やはり SD 3.5 や FLUX.1 の軽いモデルくらいは動かしてみたいと思う。のだが、A1111 氏の Web UI は開発が事実上の終了となっているように思える。というわけで、SD.Next というフォークされたフロント・エンドを導入して、試しに軽い FLUX.1 のベース・モデルを入れてみたのだが、これはちょっと誤解を生むので、ちゃんと説明している記事が増えてほしいと思うね。

結論から言えば、FLUX.1 の「軽量モデル」は嘘である。なぜなら、FLUX.1 を動かすためには、(1) ベース・モデル、(2) テキスト・エンコーダ、(3) VAE が必要で、特に T5xxl + CLIP のテキスト・エンコーダだけでもベース・モデルと同じくらい(10 GB)くらいになる。なので、FLUX.1 の「軽量モデル」が 9 GB だとしても、実際には 18 GB くらいの容量を使うことになる。僕の 16 GB VRAM の環境では、かなり難しいと言えるので、SD.Next の性能として知られている量子化のオプションで対応しないといけないらしい。

あと、UI の設定を色々と換えていると、レイアウトが変わってしまって混乱する。しかも、勝手に txt2img のタブが消えたりするので非常に困る。んで FLUX.1 はいまだに動かないので、これも少し調べてから使うかどうか決めよう。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る