Scribble at 2023-10-13 09:26:04 Last modified: 2023-10-13 15:34:39

添付画像

僕の写真20枚くらいでトレーニングした <lora:philsci:1> を適用してある。

Stable Diffusion の扱いについては、いまだに細々としたところがあって、昨日も天満橋のジュンク堂で CG の棚を眺めていたけれど、Stable Diffusion そのものを扱った本は薄くて小さなものが1冊しか出ていないようだ。それに比べて TensorFlow だ PyTorch だと機械学習や大規模言語モデルやディープ・ラーニングの本は活況を呈していると言ってもいい。

だが、出版する側にしてみれば当然だろう。技術的に高度な話題がブームになれば、素人でも手を出そうと本を買ってくれる。でも、分かるわけがないので、こういう入門書とか通俗本がどんどん売れるからだ。読み手に何らかの数学コンプレックスとか IT 用語に対するコンプレックスのようなものがあれば、消費者が勝手に通俗本を手に入れる動機を自分で作ってくれるのだから、広告(代理店)すら不要という非常に都合のいいマーケティングが展開できる

なお、これはバカにして嘲笑的なスタンスで説明しているわけではなく、何をどう言っていようと出版社というものは、こういう商業活動なのであって、個人としてどういう矜持なり正義感をもっていようと、出版社の編集者とか経営陣にはこうした思考がどこかにあるのだ。自由経済の国において、消費者がそれを不潔だの卑しいだのと言う権利はない。出版活動もまた商業活動であり、食って行けなければロハスもマルクスも愛国心も部落も在日も LGBTQ も科学哲学もエロ小説もヘチマもないのである。

それからオンラインで Stable Diffusion を解説するページの多くも、さほど増えていたり内容が詳しくなっている様子はないし、新しい動向に次々と対応しているようにも見えない。これにも、ちゃんとした理由がある(と思う)。内容が詳しくなっていないのは、もちろん Stable Diffusion を取り上げているブログ運営者の多くは、別の場所で記事を有料で販売しているからだ(良い悪いは何も言ってない)。なので、具体的なプロンプトを知りたいとか、高度な技巧について知りたいなら、1本で幾らの記事を購入してくれという誘導をしている。これは特に良いも悪いも議論するようなことではあるまい。中には KDP でプロンプトのリストとか Web UI の扱いを解説する電子書籍を販売している人もいる。いずれにしても、こういう人々はあまり記事を増やさなくなるし、増やしても内容は中途半端にならざるをえない。

それから新しい話題になりにくいのにも、それなりの理由があると思う。それは、Stable Diffusion の使い方を解説しているページやブログ記事の大半が、実質的には18禁イラスト画像の出力方法を指南しているからだ。そして、いまのところ初心者でも扱える範囲のマシン・スペックで出力できるという気軽さを維持するなら、Stable Diffusion 1.5までの環境で解説し続けるほうがよい。これは、Stable Diffusion で採用している分散モデルのトレーニング・データが Deviant Art や Pixiv といった画像投稿サイトを頼みに回収されたという事情から想像できることであり、これらは単なるアーティストやクリエイターのポートフォリオ・サイトなんかではなく(そういう目的なら Adobe の SNS を使えばいい)、事実上は違法な二次利用作品とか無修正のスケベなイラストの宝庫だからである。そして、Stable Diffusion には二次利用の作品や猥褻なイラストが大量にトレーニング画像として取り込まれていることに多くの非難が集まったことから、SD 2.0 以降では(データとして保持していても)スケベ画像、つまり NSFW (not safe for working) な画像が出にくく修正され、更に新しい Stable Diffusion XL (SDXL) では、ポーズなどの参考に使われていたスケベな画像や写真のデータがなくてもバラエティに富んだ目当ての出力結果が得られるようになっている。但し、それはつまり専用のトレーニング・データがなくても工夫次第ではスケベなポーズの画像が出力できるということでもある。よって、依然として猥褻な画像を出力するためのノウハウを紹介しているサイトは多い。日本語のページでは少ないが、中国語や英語のサイトだと、SDXL で猥褻画像を出力する情報がたくさん出回っている。それから、SDXL を動かそうとすると、さらに高いマシン・スペックが必要となって、プロンプトなども複雑になるため、初心者が付いてこれない。すると、初心者を相手に(とりわけ商売)している人々にとっては都合が悪いわけである。なので、日本語のサイトやブログ記事を見ていると、SDXL での画像出力を丁寧に紹介しているサイトはあまり見かけない。

ただ、そういう事情とは別に SD 1.5 までのデータで画像を出力している僕の経験から言って、SDXL で出力された画像を眺めても大して強い印象を受けないので、別に SD 1.5 でも動いていれば使い続けられるし、議論も続けられるのだから、敢えて SDXL に移行する必要もない。解像度の問題だけなら RTX 2060 という最低限のスペックを使っている僕のマシンですら、Tiled Diffusion という拡張機能を使って、たとえばアイドルなんかの写真集として販売されている印刷物の入稿に必要な 600 dpi ていどの解像度の画像(約 5,000 x 7,000 ピクセル)を出力できてしまうから、ひとまず印刷物の版下にもできるていどのクォリティの画像は出力できてしまう。それ以上の何を求める必要があろうかというわけである。そして、写実的な人物とか風景の画像であればともかく、イラストやアニメ調の画像であれば、大友克洋や美樹本晴彦や新海誠といった「緻密」とされる描き込みのイラストレータのテイストで出力するわけでもない限り、そこそこの描画品質であれば十分だろう。ドラえもんやキン肉マンや聖闘士星矢のイラストを 600 dpi での出力に見合う描き込みで出力するなんてことは無駄としか思えない(ただし線や着色が雑であってはいけないが)。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る


※ 以下の SNS 共有ボタンは JavaScript を使っておらず、ボタンを押すまでは SNS サイトと全く通信しません。

Twitter Facebook