Scribble at 2024-11-11 07:12:34 Last modified: 2024-11-11 07:22:16
{ "parameters": "\u0000\u0000\u0000\u0000(no human, ultra detailed, outdoors, very wide shot, perspective, scene, scenary, top down view:1.5), stunning modern urban upscale environment, ultra realistic, concept art, elegant, extremely detailed, intricate, sharp focus, depth of field, professionally color graded, volumetric fog, HDR, 32K, 16K, professional photograph with Nikon D90, Nikon AF-S 24-70mm f/2.8E ED VR, movie promotional poster, vibrant details, (in style of Marius Borgeaud:1.2) BREAK (On a distant star system, an alien artifact holds the power to manipulate energy itself. As a team of scientists study this technology, they begin to realize its potential for good or evil – and must confront rival factions vying for control over this newfound power.:1.5) <lora:hyperdetailer_v080:0.7>\nNegative prompt: easynegative, FastNegativeV2, an7-neg, badquality, nncursedV0, NegfeetV2, CR1.2-neg, verybadimagenegative_v1.3, ng_deepnegative_v1_75t\nSteps: 15, Sampler: DDIM, Schedule type: Automatic, CFG scale: 7.5, Seed: 111176282, Size: 1920x1072, Model hash: 7f6fd17a8d, Model: helloasian_V21a, VAE hash: 05cda43917, VAE: ClearVAE_V2.3.safetensors, Lora hashes: \"hyperdetailer_v080: 05dfb0659165\", TI hashes: \"easynegative: c74b4e810b03, FastNegativeV2: a7465e7cc2a2, an7-neg: f27c413efa3d, NegfeetV2: df90b1ff666d, CR1.2: 69b8e21250f3, verybadimagenegative_v1.3: d70463f87042, ng_deepnegative_v1_75t: 54e7e4826d53, easynegative: c74b4e810b03, FastNegativeV2: a7465e7cc2a2, an7-neg: f27c413efa3d, NegfeetV2: df90b1ff666d, CR1.2: 69b8e21250f3, verybadimagenegative_v1.3: d70463f87042, ng_deepnegative_v1_75t: 54e7e4826d53, easynegative: c74b4e810b03, FastNegativeV2: a7465e7cc2a2, an7-neg: f27c413efa3d, NegfeetV2: df90b1ff666d, CR1.2: 69b8e21250f3, verybadimagenegative_v1.3: d70463f87042, ng_deepnegative_v1_75t: 54e7e4826d53\", Pad conds: True, Version: v1.10.1" }
上の画像はサイズを縮小して JPEG に変換しているからメタデータが消えてしまっているので、画像を生成した際のパラメータをご紹介しておく。プロンプトに "On a distant star system, an alien artifact holds the power to manipulate energy itself. As a team of scientists study this technology, they begin to realize its potential for good or evil – and must confront rival factions vying for control over this newfound power." という文章が記載されていて、ここが描写する情景を指定してある箇所だ。プロンプトでそれ以外のキーワードは、テンプレートとして他の画像を生成するときにも使っているから、どういう画像を出す場合でも同じだ。
ということで、無数の色々なシチュエーションの画像を作りたいときは、この可変箇所をワイルドカード扱いにしてランダムにプロンプトへ挿入されるようにしておく。そして、ワイルドカードに適用される候補のキーワードを大量に用意しておく。もっとも、全く同じキーワードでも seed や cfg scale と呼ばれるパラメータが乱雑さを生み出しているので、或るていどは異なる画像が生成される。
ランダムにワイルドカードへ適用している文章のようなキーワードは、LM Studio を使って、つまり別の生成 AI システムを使って出力している。シーンを指定する幾つかの条件を与えて、最低でも 200 keywords を使ってプロンプトを生成せよと頼めば、いくらでもつくってくれる。ただし、何らかの乱雑さを求めておかないと、生成 AI には一つのチャット(会話のやりとりというシーケンス)でいちどに処理できるデータの量に限界があるから、そのうち始めの頃に出力した内容を忘れてしまって、再び同じようなレスポンスを出力してしまうから、一定のタイミングでチャットをリセットして再び始めから(少し条件を変えて)やり直すのがよいだろう。僕の場合、だいたいプロンプトを50個くらい出してもらったら切り替えるようにしている。この限界は、LM Studio だとチャット画面のいちばん下に、「トークン: 3269/4096」などと表示されるのでわかりやすい(これはプロンプトを50個ほど出してもらったときの総数)。この限界を超えると、context として AI がいちどに処理できるプロンプトの限界を超えているので、応答が出せなくなるかもしれないという警告が出てくる。