Scribble at 2026-01-24 08:21:29 Last modified: 2026-01-24 08:33:22

添付画像

#Gemini にイラストを描かせると困るのが、いくら禁止しても、チャットで日本語を使っているとイラストに日本語を使おうとすることなんだよね。

AI を運用する環境というものは、もちろんハードウェアという条件なり制約があって、いくら最新のモデルが素晴らしいと言われても、それをそのままローカル・マシンで動かせるわけではない。昨年の末に登場した、Qwen-Image-2512 や FLUX.2 [klein] などといった最新の画像生成 AI モデルは、もちろん詳細で破綻の少ない優れたモデルだとは思うのだが、これはオリジナルのベース・モデルとして僕の環境に導入して動かすことはできない。

僕の自宅マシンは、Ryzen 7 + 32 GB RAM + 2 TB SSD + GeForce 5060 Ti (16 GB) というスペックであり、画像生成 AI をカジュアルに運用するだけなら、Gemini の評価では「ハイ・ミドル」といったグレードになるようだ。しかしそれでも、これら最新のモデルは更に多くの GPU メモリを要求しており、もちろんモデルを入れて動かすだけなら(CPU あるいはページング・ファイルへのスワップを想定して)動かせるモデルもあるが、恐らく画像を1枚だけ出力するのですら10分くらいかかるだろう。SDXL だと、壁紙サイズ(1920 x 1080)の画像を出力するのに、おおよそ5秒ていどしかかからないことを思えば、僕の環境で最新の巨大なベース・モデルを動かすというのは、生産性として全く話にならない。(ただし、僕が常用しているのは SDXL Lightning モデルだったり、LCM 対応で生成を加速する LoRA だったりする。)

こういうわけなので、ローカル・マシンの環境だけに限ったことではないが、スペック、それからクラウド・サービスを使うなら金銭的なコストも含むわけだが、それらと所要時間や出力された画像の品質などは、おおよそトレード・オフの関係となる場合がある。もちろん、手持ちのスペックで十分に動くモデルどうしを比較するなら、それはまた別の基準で比較しなくてはならない場合があり、たとえば SD 1.5 と SDXL は僕のマシンならどちらもフル・スペックで動作するし、生産性にも劇的と言えるほどの差はないのだが、後発の SDXL が常に SD 1.5 よりも優れているかと言えば、そうでもなかったりする。特に、LoRA を自分でトレーニングして作成している方なら実感としてご理解いただけると思うが、LoRA の学習効率や再現度は、SDXL よりも SD 1.5 の方が優れている(学習素材の再現度が高い)場合が多々あるので、SDXL で学習させる素材として、パブリック・ドメインとして公開されている写真データや、検索した画像データではなく、寧ろそれらでいったん作成した SD 1.5 の LoRA で生成した画像を、今度は SDXL の LoRA を学習するための素材として使ったりすることがあるほどだ。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る