Scribble at 2025-09-01 12:22:32 Last modified: 2025-09-01 12:36:10

添付画像

SDXL の LoRA を制作してみようというわけで、これまで使っていたシステムから OneTrainer というのに変更している。パラメータの項目が詳細で、丁寧に扱えるということが一つの理由だ。しかも、トレーニングに使う画像をランダムに回転させたり反転させたりする機能もあるため、学習させたい物体の種類によっては少ないリソースで効率的な学習ができそうだ(人物の写真とかでは、やらないほうがいい)。

ただ、問題はいつものようにドキュメントが少ないということである。しかも、海外の英語で書かれたドキュメントも含めて(いや公式のチュートリアルすら含めて)、貧弱なドキュメントしかないので、パラメータを一つずつ設定しながら結果を出して効果を確かめるという、非常に面倒臭いことをやらなくてはいけない。理論的な計算上の効果がはっきりしているとしても、拡散モデルの場合はマルコフ性をもつ確率過程でノイズを加えたり除去していくプロセスを扱っているので、パラメータの「意味」が分かったとしても、それだけで画像を生成するにあたっての効力が明確に解説できるとは限らない。やってみないと分からないということが、生成 AI を使うときの楽しさでもあるが、リスクでもある。創造力は、優れたクリエーティブをもらたす可能性もあるが、他方でものごとを壊滅させる原因にもなりうるのであり、原子力だろうと発達障害だろうと同じことが言える。手放しに称賛したり非難するようなことではないのだ。

というわけなので、OneTrainer の丁寧な解説を制作してもよいなと思っている。もちろん既に幾つかのブログ記事や note の投稿などで取り上げられているが、ああしたところでものを書いている連中は、知識の共有とかツールの普及という目的なんて実はもっておらず、どういう話題であろうと有料コンテンツやアフィリエイトのリンクをクリックしてもらうための「ネタ」をバラ撒いているにすぎない。よって、OneTrainer の設定についても、絶対に体系的な情報を十分に与えるなんてことはしないし、そんな素養や見識や経験なんて、ああいう連中は持っていないのだ。自宅にパソコンをもってるかどうかすら怪しい連中と言って良い(WELQ で記事を書いている学生や主婦のように、パソコンすらもっていなくてもタブレットやスマホで ChatGPT が吐き出したインチキなテキストを「記事」として投稿してる連中なんて、いまどきハエのようにたくさんいる。もちろん、世界中にだ)。なので、常に情報は不完全であり、些末であり、一時的な有効性しかなく、底が浅い。参考にしようとするだけ無駄である。電子書籍や単行本として出版すらしている者もいるようだが、あんなのは YouTube で出鱈目に喋ってるガキの落書きを印刷したような代物であって、金を出して買う値打ちなんてないのだ。

あと、今年に入ってからは Reddit のようなサイトのコンテンツが勝手に日本語へと翻訳されて検索にヒットするようになったのだが、そういうものもたいていは翻訳の精度に問題があるし、内容そのものも読むに値しない、はっきり言って「オタク談義」の域を出ないものだ。パソコンのオタクというのは、自分が他人よりもどれだけ情報(もちろん、たいてい彼らはコンピュータ・サイエンスの学位なんて持ってないから、程度の低い雑学レベルの業界知識にすぎない)やパワフルなパソコンをもっているかという、マウンティングやヘゲモニーの掌握という動機しかもっておらず、従来の意味での「マニア」や「ファン」とは異なるメンタリティの集団なので、実はコンピュータに興味なんてもっていないのである。なので、原文が英語だろうと関係なく、そういうやりとりのログを読んだところで得るものは殆どない。彼らが何を言っていて何を言っていないかという点から制約条件を見つけ出すなんて作業を、他人がわざわざやる必要などないのであって、そんなことに時間を使うくらいなら、公式のドキュメントを参照しながら自分自身でツールを使ってみた経験を積み上げる方がよい。そして、そういう経験を蓄積して互いに評価している人々を、ふつうの社会では「プロパー」と呼んでいるのだ(大学でも企業や官公庁の研究機関でも、ごく当たり前のように行われていることだ)。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る