Scribble at 2024-02-23 11:50:29 Last modified: unmodified

添付画像

Stable Diffusion 3 の先行プレビューを発表します。このモデルは、複数主題のプロンプト、画質、スペリング能力などのパフォーマンスが大幅に向上した、高性能なテキスト画像変換モデルです。

Stable Diffusion 3

どうして日本語の専用サイトがあるのか、いまだに事情がわからないのだけど、ともかく日本語でも Stable Diffusion の次世代バージョンが発表された。「複数主題」への高度な対応がアナウンスされているため、一つのセッションに異なるコンセプトのプロンプト・グループを整合的に配置できるようになることが期待できるのだろう。

もちろん、現在でも Stable Diffusion Web UI などの AND 構文を始めとして、ひとまとまりのプロンプト・グループを独立に処理する方法はあるのだけれど、精度はさほど高くない。そして、複数の LoRA を同時に使用した場合の混乱を正確にコントロールするのが難しいという問題もある。階層を指定して LoRA の適用度合い(ベースになっている分散モデルに対する修正度合いとも言える)を細かく調整して対応はできるけれど、はっきり言ってこの上なく面倒臭い。LoRA ごとに、どの階層がどういう影響を与えるかが異なるからだ。こういうのをプロンプトで、まさしくプログラミングするようにコントロールできるとありがたいんだよね。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る


※ 以下の SNS 共有ボタンは JavaScript を使っておらず、ボタンを押すまでは SNS サイトと全く通信しません。

Twitter Facebook