Scribble at 2024-02-15 14:41:25 Last modified: 2024-02-15 15:06:50
生成 AI、特に Stable Diffusion 関連でプロンプトの解説をするなんて言ってるサイトの大半が、実はただのアフィリエイトや自社の宣伝サイトだったりする話を書いたことがある。もう既に膨大な数のサイトやブログがあって、その半分以上が生成 AI そのものを使って複製された、SEO 業界では "distributions" と呼ばれているスパム・サイトである。そして、そういうサイトの大半は、実際には画像を作ったりプロンプトを設定するときの参考にはならない、クズみたいな記事ばかりで占められているため、初心者が情報を探そうとしても、既に Google の検索なんかでは相当な手間がかかる(もっとも、これは既にどういう情報を見つけるときでも似たような事情になっているわけだが)。そして、情報サイトとして質が悪いだけではなく、それらの中にはフィッシング・サイトも混じっているので、それなりにシビアなゴミ掃除をした方がいい。
ただ、そういうゴミ掃除にひどく時間がかかるかというと、記事の内容をいちいち読まなくても、サイトへアクセスしてページが開いた時点でゴミであるかどうかを判断するヒントは幾つかある。必ずしも全てのサイトが以下のような条件を満たすわけではないし、良質なサイトも以下の条件を満たす場合があるけれど、おおよそ以下の条件で三つ以上を満たすなら、「ゴミ」と判定してもいいだろう。そして、それが偏見や間違いだったとしても、他に良質なサイトを探せたらそれでいいのだ。僕らは、迂闊に幾つかの間違いを犯しているだけの善人を救いだして正しく評価してあげることが目的で情報を探しているわけではないからである。そういうことは社会学者に任せておけばいい。
(1) サイド・バーに書籍やグラフィック・カードの広告がある。
(2) ヘッダーで表示されているサイト名がただのテキスト。
(3) どこかで見たことがあるレイアウト。
(4) 記事の最後にかならず「快適に生成するには・・・」とハイスペックなパソコンやビデオ・カードの宣伝がクロージングとして語られる。
(5) そもそもヘッダーとかに使われている AI で生成したらしき画像のクォリティが低い。
(6) 日本語の使い方がおかしい。
(7) 解説の中に、プロンプトの実例が殆どない。
(8) 解説の大半をプロンプトも分からない挿絵のイラストが占めている。
まず分かりやすい (1) から説明しよう。僕らのような、プロのデザイナーでもあり、機械学習にかかわる数学などの素養がある人材でもあり、そしてそれに加えて実際に去年の夏頃から Stable Diffusion を使って数百万枚の画像を実際に作って社内の研修教材とかに使っている実務家の一人として言うと、いま書店で見かける生成 AI や Stable Diffusion 等の画像生成に関する解説本や紹介本の 99% はクズである。よって、そういう解説本にリンクしているサイトは、全てそれなりに質の悪いアフィリエイトだと判断して構わない。実際にそれらの解説本を書店で眺めてみれば分かることだが、イラストの質も悪いし、プロンプトのエンジニアとしても無能だと思うし(英語すら分かってないやつも多い)、そもそも動作原理の数学や機械学習を殆ど理解していない、工学の世界ではサルに等しい連中が書いている。おまけに、イラストあるいは写真としての線や色や構図や光源など、デザインの素養も殆どないため、工学だけでなく芸術や美学という分野の知識や経験もない人間が書いていると思われる。つまり、暇な学生とかウェブ制作会社のコーダとかが、他にやることがなくて、エロ画像ばっかり吐き出し続けた経験談を書いてるだけというのが実態だろうと思う。掲載されている画像はエロ画像ではないが、もともとそういう画像ばっかり吐き出してる連中が、出版にあたって穏当な画像を出力しただけにすぎないというのが、実はデザインの素養がある人間やプロのイラストレータや写真家から見ればバレバレである。たとえば、砂浜の上で女の子がハイヒールを(脱いで手に持ってるんじゃなくて)履いてたりする。こんなのは、普通のイラストレータや写真家ならありえないだろう。もともと水着のイラストしか出力してないような連中が、出版物用の素材を作るにあたって、女の子に洋服だけ着せるなんていうイージーなプロンプトで画像を吐き出すから、そういうことになるのだ。
次に (2) は、もちろんコピーで作ったブログとか、あるいは流行に乗っかってアクセスを集めたいというだけの理由で急いで作ったサイトであるため、ヘッダーのサイト名がただのテキストなのである。仕事としてデザインに従事している人間なら、せめてヘッダーに掲載するサイト名くらいはオリジナルのロゴを作りたいだろう。また、急いで作ったサイトではなく昔から運営されているサイトであれば、ロゴを作る時間なんて幾らでもあったわけで、たいていはロゴを丁寧に作っているものだ。
そして (3) も、コピーで乱造しているブログなどはレイアウトが似たようなものばかりになる。というよりも、手を抜くとコピーであれなかれ同じような作りになるのは当然だ。もちろん、本文のペインとサイド・バーのペインだけという典型的なブログのレイアウトで運営されているサイトでも、良質な情報を提供している事例はある。が、ゴミのようなサイトの必要条件は、やはり手抜きであるから、これも条件に入れておいてよいだろう。
(4) は (1) と同じ話である。スペックの高いマシンやビデオ・カードを使うほうが快適に画像を出力できるなんてことは、誰でも知っている。なので、わざわざ全ての記事の末尾に営業マンのクロージングみたいなフレーズを入れるのは、自分でアイフィリエイト・サイトでございますと自己紹介しているようなものだ。これも、おそらくは本文を生成 AI で自動出力しているから、読み手に違和感を与えるなんてことに気づかなくなるのだろう。もし自分の手でコーディングして同じフレーズをコピペし続けているなら、もう既にその人は「ゾンビ」並みに感受性や思考力が欠落していると言ってもいいだろう。そんな人間に、いかにツールを使っているとはいえ良質な画像を生成する知能なんてあると思うかという話だ。
(5) は、もちろん生成 AI を使って出力した画像であるから、馬鹿でも一定の確率で「佳作」を出力できる。よって、常にしょーもないイラストや写真ばかりだとは限らないのだが、とにかく、いかにサンプルとはいえありきたりな写真や画像ばかりなので、手抜きだとすぐに分かると思う。これは幾つもの分散モデルを使っていれば分かることだが、いわゆる「マージ・モデル」と呼ばれて幾つかの分散モデルを組み合わせたモデルであっても、元になっている分散モデルの数が少ないので、どう組み合わせても一定の特徴を抜けない。したがって、LoRA のように追加のテンソルで矯正するようなことをやらないと、分散モデルだけで画像を出力すると、特に写実的な画像は顔が同じようなものばかりになるし、表情もありきたりで、いわゆる「マスピ顔("masterpiece" より)」と呼ばれる画一的な絵柄になってしまう。そういう画像ばかりサンプルに使っているのは、要するに手抜きの証拠なのだ。
(6) は、もちろん外国人(国籍は特に関係ない)が翻訳ツールだけでサイトを作っていたり、日本人のサイトから文章をコピーして、幾つかのキーワードを適当に置き換えて作っただけという可能性もある。それから、なげかわしいことだが、本当に日本で生まれ育った人間でも、実際には中国やベトナムの留学生よりも酷い日本語の文章を書く大学生なんてたくさんいるのである。ともあれ、どういう事情にしても文章を読んでいて違和感があるなら疑うことである。そして、それは自分で書いた文章を読み返してもいないという点で、そのサイトが殆どメンテナンスされていないという証拠にもなる。たとえば、ここで僕がこうして「落書き」と自称して書いている文章ですら、最低でも3回くらいは何日か経過した後でも読み返して、細かい誤字を訂正したりしている。この文章の冒頭でも掲載している、初出の日時と最終更新日時の違いでも分かると思う。
(7) と (8) は、特に自費出版とかで電子書籍を販売しているような人々に多い傾向だ。画像の生成について解説すると称してブログ記事などを公開しておきながら、実際に読むと概念的な話ばかりでプロンプトの実例がなかったり、プロンプトで肝心の箇所を「(ここでプロンプトを記入する)」などと書いて、具体的にどうプロンプトを記述するのか、姑息な手法でわからないようにしてある。そして、もっと詳しいことが知りたいならこちらと称して、note の有料記事だとか電子書籍の商品ページに誘導する。しかし、そんな記事や電子書籍に書いてある内容なんて、実際には大したことはない。僕が見た限りでは、商業ベースのプロダクトとして使えるような画像を生成している、本物の「プロンプト・エンジニア」と言える人材は、この手のブログなんて運営していないし、電子書籍も書いてはいない。そもそも、そんな資格は存在しないのだから、自称している人間に限って、そう自称できるだけの基準がなんであるのかも分かっていないインチキだ。