Scribble at 2025-01-19 09:12:04 Last modified: 2025-01-23 15:19:43

添付画像

画像の生成 AI について調べると、たとえばこのサイトなんかも検索の上位によく出てくるんだよね。初期(とは言っても、せいぜい2年前だが)からあるらしいので、そういう意味でのアドバンテージはあるんだろうと思うけど、正直なところお勧めしない。

運営者は生成 AI のコンサルをやってる、たぶん個人事業主なんだろう。でも、当人の見識や技術力や実績がまるで分からない。言っちゃ悪いけど、生成 AI はオンライン・サービスのパワー・ユーザとして Evernote のコンサルとかやってた詐欺師どもとは違って、単にツールの使い方を知ってるだけではだめなんだよね。そんな底の浅い知識ではクライアントのニーズに最適化したテキスト解析アルゴリズムは提案できないし、してはいけない。最低でも日本の大学の工学部の博士号ていど(つまり博士論文が書けるていどの離散数学と機械学習の知識)は必要だし、顧客のニーズを把握する経験としても就労経験が5年くらいあって当然だ。そういうところがぜんぜん分からない。

それに記事を読んでいても、まず情報が古いし更新すらしようとしていない。流行の話題について適当に書いて放置しておき、SEO だけで集客しようなんてのは、平安時代のコンテンツ・マーケティングだ。せいぜい2年ていどの経過期間だからさほどラングは下がらないからいいものの、こんなコンテンツを放置しておけばすぐにランクは低下してくる。

次に、内容を丁寧に読むとデタラメを書いてることがすぐに分かるんだよね。僕らみたいに生成 AI を業務でも趣味でも利用してる人間から言えば。たとえば、

「“Safe Tensor”とは、『安全なモデル』という意味ですので選んでおいて損はありません。」

なんてデタラメを書いてるけど、モデルの拡張子であることすら知らない(つまりは、この人は自分で画像の生成 AI を使ったことすらないんじゃないかと疑えるレベルの)素人が書いてるのがすぐに分かる。もちろん旧式の ".pt" 拡張子のモデルに脆弱性があって安全に改良されたのは確かだが、それをいくら素人向けだからといって「安全なモデル」という意味なんて書くのは素人を馬鹿にしてるし、"safe tensor" と単語を分割して書けばいいってものでもない。だいたい、拡張子は ".safetensors" だよ。単語の複数形をぞんざいに扱うのは、英語が出来ない人間の典型だ。

それと、このサイトには「累計10,000枚以上画像生成を行った」人物として自費出版の電子書籍を宣伝する広告があちらこちらに貼り付けてあるのだけど、これも僕らのような本当に生成 AI を駆使している人間から言えば「カス」みたいな実績だ。だって、単純に画像を10,000枚出すだけなら、そんなもん1日でやれるからだ。ちゃんと使ってる人は分かると思うけれど、SD 1.5 だったら最も生成の効率が良い 512x512 ピクセルの画像で、これまた最もノイズの収束が速いとされる DDIM のサンプリング・メソッドを使えば、僕の非力なマシンでも1枚の出力にかかる時間は5秒ていどだ。つまり、1分で10枚は出せるのだから、1時間で600枚、12時間ていどフル回転させたら7,200枚を生成できる。RTX 2060 6 GB のスペックでこれだけ出るのだから、いまどきのミドル・レンジである RTX 4070 12 GB なら、この1.5倍くらいの生産性はあろう。要するに、10,000枚の画像を単に生成するなんてことは、さして他人に自慢するような実績でもないし、いわんや生成 AI の専門家の証明になどならないのだ。

言っちゃ悪いけど、僕は2022年の6月から累計で80万枚くらいは画像を作ってるよ。そして、これはハードディスクにアーカイブしてある枚数を数えてだから、実際には間引きしていない枚数を数えたら数百万枚は出しているはずだ。まぁ、僕の場合はこんなこといちいち言わなくても離散数学やディープ・ラーニングの勉強をひととおりはやってる科学哲学者としても、それから生成 AI を仕事でも使っている実務家として自負できるていどの素養はあるわけだけど、それでも自分では修士課程の学生ていどだろうと思ってるから、いちいち当サイトで記事を公開したり電子書籍で小銭稼ぎするなんてことは、やればできるがやっていないだけだ。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る


共有ボタンは廃止しました。