Scribble at 2024-10-09 14:43:30 Last modified: 2024-10-09 14:55:18
Stable Diffusion の拡散モデル("checkpoint" などとも言われる)のレビューというか比較サイトがなかなかなくて、初めて使うという方は困惑しているのではないかと思う。それもその筈で、実は拡散モデルの比較を公開していたページというのは、昨年いっぱいで殆どが更新を止めてしまっているから、そもそも参考にするページがないのである。そして、それに加えて比較の仕方が不十分であるか、明らかに不適切な比較をしているページも多い。
たとえば、画像の出力サンプルを並べて比較するのであれば、同じプロンプトと同じシードなどを設定して出力するのが当たり前である。しかし、この拡散モデルはこんな画像、あの拡散モデルはこんな画像が出せるといって、ぜんぜん比較しようがないサンプルを並べているページが意外に多い。こういう人たちは、アメリカ人であっても "comparison" という単語の意味を分かっていない無教養な人たちなので、そもそも他の内容についても信用しないほうがいい。(アメリカ人だからといって英語を分かってるとは限らないし、単語が意味する概念を理解しているとは限らない。そういう人は、ただの英語を話す馬鹿でしかない。)
それから、単に情報が古いとか偏っている場合もある。国内では(或る界隈では)有名な「としあき diffusion Wiki」というサイトに掲載されている拡散モデルの一覧は、5ちゃんねるのユーザが使っているという前提で紹介されているので、はっきり言ってかなり偏っているし、網羅性もぜんぜんない。また、画質や描画の比較も感覚的・主観的な表現でしか解説されていないし、なによりも出力サンプルの画像がまったく掲載されていないので、正直なところ参考にならない。加えて、その Wiki に集まっているユーザの多くは自宅のマシンでモデルをマージしたりトレーニングできるようなパワー・ユーザであるため、恐らくは利用している分散モデルの主流が既に Flux.1 や SD3 などに移行しており、SD1.5 や SDXL などは情報が更新・追加されていない。なので、僕のように SD1.5 しか動かないような環境で利用しているユーザには、敷居が高くて逆に使えないサイトとなってしまっている。しかし、実は SD1.5 のユーザはマシン・スペックに関係なく、いまでも相当な割合でいるのだ。実際、投稿サイトでも SD1.5 を利用して出した画像が多々あるし、生成 AI だけのためにパソコンを買い替えるような人は、そう多くない。なので、自宅のマシンで扱える範囲という条件なら、いまでも SD1.5 しか動かないパソコンを使っている人は多いと思う。他にも、プロンプトのリソースが多いとか、LoRA が多いとか、幾つかの理由がある。
しかし、丁寧に比較しているページが意外と少ないのは、昔もいまも困ったことだ。たとえば、出力した画像を拡大して並べたり、使われている色のトーンを解析して(難しい? Photoshop で画像を開いてヒストグラムの画面をスクリーンショットでもらうだけでもいいのに)比較したりということをやっているサイトが殆どない。単なる見た目の印象を書いているだけのサイトが殆どだ。やはり、プロのイラストレータやカメラマンやデザイナーが手掛けていないという事実が、こういう状況を説明するのだろう。もちろん、僕はプロのデザイナーであるから、僕が拡散モデルの比較をするなら、そういういった解析も含めて幾つかの明白な違いが誰にでも見て取れる結果は紹介するだろう。