Scribble at 2025-07-23 19:59:34 Last modified: 2025-07-23 20:03:13

添付画像

bulletin board text, "YEAH!"

Steps: 30, Sampler: DPM++ 3M SDE, Schedule type: Karras, CFG scale: 4, Seed: 3201254523, Size: 1024x576, Model hash: f327bf38a5, Model: stoiqoNewrealityFLUXSD35_XLPRO, Clip skip: 2, Token merging ratio: 0.5, Hardware Info: "RTX 5060 Ti 16GB, 7 7700 8- Processor, 31GB RAM", Time taken: 9.0 sec., Version: v1.10.1-89-g2174ce5a

STOIQO NewReality

Stable Diffusion SDXL のベース・モデルにも色々と、Stability.AI が公開したモデルにマージを重ねたモデルが作られていて、実は大半がアニメのベース・モデル(特に Illustrious)だったりするわけだが、実写系でもいくつかの有力なベース・モデルがあって、Stable Diffusion 1.5 を使っていた頃は "ULTRA" というベース・モデルを愛用していたけれど、SDXL では上の "STOIQO NewReality" を試しているところだ。ちなみに、メインのパソコンを新調して VRAM が 16 GB の環境になったとは言っても大きなモデルは扱えない。たとえば SD 3.5 などは、量子化などで軽量にしてあるモデルでも 15 GB くらいはあるから、なかなか軽快には使えないので、僕の環境では SDXL を利用するのが現実的だと思う。

SDXL が SD 1.5 と比べて異なる点は多々あるが、まずパラメータ数が4倍になってプロンプトへの忠実度が正確になった。その筆頭として恩恵を受けるのが、テキストの表現である。実際、上のプロンプトを使っても、SD 1.5 では正確に "YEAH!" なんていうテキストは殆ど描けなかったのだが、SDXL なら10枚ほど出すと半分くらいは正確に "YEAH!" と描いてくれる。しかも、失敗した画像でも「!」がないだけとか、些細なミスで済んでいる。ちなみに、多言語対応ではないので、「手旗信号」と入力しても漢字は描いてくれない。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る