Scribble at 2025-10-17 20:59:44 Last modified: 2025-10-17 21:00:18
autumn twilight over Exmoor, mossy stone walls of Castleton, ivy climbing ancient ruins, amber glow of sunset, distant hills of Somerset, mist curling around stone steps, old stone bridge arching over river, silver fish glinting in water, faint echo of church bells, rusted iron lanterns hanging on cottages, quiet village lanes, faded blue doorways, cobblestones worn smooth by centuries, distant farmhouses with haystacks, golden fields of barley, gentle breeze carrying scent of wild rosemary, soft cloud shadows over moorland, low light filtering through fir trees, ancient stone circle hidden in forest glade, serene pond reflecting sky. stunning upscale environment, ultra realistic, extremely detailed, intricate, sharp focus, depth of field, HDR, 32K, 16K, photorealistic rendering captures the intricate folds of the fabric and its elegance with precision, natural lighting, movie promotional poster, vibrant details, studio quality, UHD, trending on artstation, creative professional photograph in style of Daniel Kordan by Leica M10, Summilux-M 50mm F/1.4 ASPH, Ilford Delta 100 Professional, traditional media, monochrome, greyscale, black and white photograph, professional greyscale photograph
FLUX.1 Krea dev の8ビット量子化モデルを使い始めているのだが、どうもイマイチな出来栄えである。これだと SDXL を2倍ていどにアップ・スケールした方が良い画像を出してくれる。だが、上の画像でも使い始めた頃に比べればマシになった方だ。最初はクレイ・アニメのような質感で唖然とさせられたものである。
Black Forest Labs の公式ドキュメント(あまり充実しているとは言えないが)によると、プロンプトの構成としては "Subject + Action + Style + Context" のようになり、とりわけ風景の画像を出す場合は "[Location/setting], [time/weather], [camera angle], [style], [atmosphere]" という順番と構成が推奨されている。ただ、FLUX.1 のようなモデルになると、自然言語の文章でプロンプトを与えても適切に解析してくれると期待して良いだろうから、これは飽くまでもキーワードの重みや優先度の問題なのだろう。そういうわけで、実際には上に引用したようなプロンプトで作成している。
ちなみに、前半部にあたる "autumn twilight over Exmoor, mossy stone walls of Castleton, ivy climbing ancient ruins, amber glow of sunset, distant hills of Somerset, mist curling around stone steps, old stone bridge arching over river, silver fish glinting in water, faint echo of church bells, rusted iron lanterns hanging on cottages, quiet village lanes, faded blue doorways, cobblestones worn smooth by centuries, distant farmhouses with haystacks, golden fields of barley, gentle breeze carrying scent of wild rosemary, soft cloud shadows over moorland, low light filtering through fir trees, ancient stone circle hidden in forest glade, serene pond reflecting sky." が情景を指定する箇所であり、ここは「世界の絶景 1,000 スポット」みたいな観光本からイギリスの観光地を選び、OpenAI のオープン・ウェイトなモデルである GPT OSS 20B (MXFP4) を LM Studio で展開してから、プロンプトに使う描写としてテキストにその場所の記述を表現してもらったものだ。そして後半部は、カメラや写真家などを指定するスタイルのキーワードである。