Scribble at 2025-07-28 20:16:59 Last modified: 2025-07-28 20:48:23

添付画像

Stable Diffusion Web UI には、ReActor という有名な拡張機能があった。「あった」と書いたのは、この拡張機能をリリースしていた GitHub のリポジトリが規約違反で閉鎖されているからだ。それもそのはずで、画像1枚だけで他の画像の顔を高精度で置き換えられるから、要するに「ディープ・フェイク制作ツール」という用途で広く知られていたし、実際にそういう用途で使われていたからだ。実際、「画像も動画も!ディープフェイクするならこれ一択【Reactorの完全ガイド】」(https://stable-diffusion-media.com/reactor/)などと億面もなく記事にしているゴロツキもいるし(「ディープ・フェイク」って単なる技法のことだと思ってるんだろうけど、言葉が社会でどう扱われてるかに無頓着なのは「理系」ではなく「バカ」と言うんだよね)、僕が何度か参考にさせてもらった Daniel Sandner 氏のサイトですら、ただのツールとして紹介されているのは困ったものだ。こういうサイコパス的な無頓着さに、AI 嫌いの人々は頭にくるのだろう。それはわかる。

それはそうと、Daniel Sandner 氏のサイトにはいくつかの参考になる論説が掲載されているのだが、どうやら今年に入ってから更新が止まっているらしく、論説の公開は昨年の末で止まっている。半年も新しい論説が追加されていないのだから、これは事実上の更新停止であろう。もちろん、仕事が忙しくなったり、あるいは家庭の事情などで更新が止まることはあるし、それをどうこう言う権利など他人にはないわけだが、画像生成 AI の実情を考えると仕方のないところだろうと思う。

Civitai.com などで公開されている merged models の数で分かると思うが、SD 3.5 や FLUX.1 以降のベース・モデルをリリースしている人は僅かだ。もちろん理由は、モデルを再トレーニングするだけの予算がたいていの人にはないからである。SD 3.5 だと、かなり軽いモデルでも 10 GB を超えるし、FLUX.1 にもなると量子化してすら 9 GB で、たいていのモデルは 16 GB を超える。こんな巨大なモデルをマージしようとすれば、それこそ VRAM が 32 GB くらいあるグラフィック・カードを載せたコンピュータ、あるいは同等の性能をクラウド・サービスで利用しなくてはならない。正直、それで飯を食っているわけでもないなら、グラフィック・カードだけで60万円するようなパソコンを購入する人などいないだろう。

つまり、いくらオープンだの何のと言われても、昨年度以降にリリースされた画像生成 AI のベース・モデルは、個人がホビーとして扱える限界を超えているのである。Daniel Sandner 氏はホビーとして生成 AI を扱っているわけではないにしても、大学や研究機関のプロパーではなく "independent scholar" であるから、経済的に豊かな身分でもない限りアマチュア同然の人物がコンピュータに何百万円も使えるかどうかは分からない。FLUX.1 の記事もあるから、自分のマシンで扱えているなら相当なスペックのマシンは所持しているのだろう。でも、さすがに SD 1.5 のモデルを使って大量の画像を生成して実験するような調子で FLUX.1 を使えるかどうかはわからない。なので、記事を増やせないのかもしれない。それに、あるていどまでいくと調べたり学んだりする意欲がなくなる人が多いんだよね、この分野って。数学的なバックグラウンドがある人物ですら、興味を失う人が多いようなので、仕方がないところもあるのだろう。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る