Scribble at 2026-01-20 06:36:31 Last modified: 2026-01-20 06:42:44

画像生成 AI のフロント・エンドとして、メインを Forge Neo にした。ただし、これまで使ってきた A1111 氏の Web UI は画像に対してタグ(キャプション)を読み取る拡張機能が使えるから、これのフロント・エンドとして暫く使う予定だ(Forge Neo は A1111 版の拡張機能を流用する体裁だが、実際には殆どの拡張機能がインポートできても動かない)。それから ComfyUI は、ACE-Step で音楽を作れるという理由から、これも ACE-Step だけのために残す。ただし、どちらも alternative があれば手放す予定だ。

特に ACE-Step は作曲のコントロールが非常に難しくて、モデルそのものも熱心にアップデートされているわけでもなく(HuggingFace で昨年の5月以降はモデルが更新されていない)、そして関連する情報が殆どない(いわゆる、「入れてみた」「使ってみた」式の、猿でもできるようなことを書くブログ記事ばかりだ)ので、運用方法を Gemini にすら相談できないという貧弱な状況だ。なんだかんだ非難されながらも音楽会社との法的な問題をクリアしながら運営されていて、月額1,500円を払えば商用利用もできる SUNO AI をベースにするほうが、効率としても手にする曲の品質としても優れている。

A1111 のタグを付ける拡張機能については、もちろんいままで SDXL を使って LoRA をトレーニングしてきたから利用していたのだが、X-Image Turbo の LoRA を作るとなると、それに応じたツールが必要となり、そういうツールにはタグ・マネージャが付属するであろうと期待できる(まだ手を付けるつもりはないが)。そうなれば、タグのためだけに仮想の Python 環境まで含めた一式を無駄に置く必要はないので、いよいよ A1111 版の Web UI ともお別れである。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る