Scribble at 2023-12-04 11:20:36 Last modified: 2023-12-04 11:25:53

添付画像

Stable Diffusion で最初に生成した画像を「アップ・スケーリング」という手法で改めて高精細化して描き直すという手続きが頻繁に使われる。これは、まず負荷の低い設定で大量の画像を生成してから、良好な出来栄え(期待した構図だとか、手が3本出たりしてないとか、あるいは目当ての技法で描かれているとか)の画像を選別して、改めて高精細の条件に設定を変えて出力し直す方が効率的だからだ。簡単に言えば、生成 AI で出力される画像の大多数は出来損ないであって、それこそ顔が潰れていたり指がネジ曲がっていたりと気の毒な見栄えの画像ばかりだ。どれほど大量の写真やイラストでトレーニングしたアダプター(LoRA)を使っていようと、生成される画像の品質には一定の乱雑さによる限度というものがある。したがって、特に品質のよい画像を使いたい業務レベルの工程では、最初から高画質の設定で画像を一つずつ丁寧に生成させるような非効率は避けなくてはいけない。

おおよそ良好な元画像が出たら、それを使って細部を impainting で描きなおしたりする。それと同時に、アップ・スケーリングで高精細化して、Photoshop などでの最終工程に送るわけだが、このアップ・スケーリングを単なる機械的な「高精細化」として扱えない場合もある。なぜなら、アップ・スケーリングしても高精細にならない場合もあるからだ。

ここで上に掲載した画像は、上段が 768x1024 ピクセルで出力した元画像であり、下段が img2img で4倍にアップ・スケーリングした画像を元の画像と同じサイズで並べられるように Photoshop で縮小してある。細かく見てゆくと、A で示した箇所のように、上段の元画像よりも下段の高精細画像が細かく描き込みされていて輪郭もくっきりしている。しかし逆に、B で示した箇所では逆に高精細化した画像の方がボヤけてしまっている。「ボヤける」というのは、画像を制作する目的によっては正しい結果であって、必ずしも悪いことではない。しかし、必要もないのに高精細化した筈の画像で逆に元画像よりもボケてしまうのは困る。このように乱雑さが伴う生成の過程では、意図しない結果が一定の割合で起きてしまう。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る


※ 以下の SNS 共有ボタンは JavaScript を使っておらず、ボタンを押すまでは SNS サイトと全く通信しません。

Twitter Facebook