Scribble at 2026-04-04 16:17:40 Last modified: unmodified

添付画像

Unforgettable mountain vista, winter, Captivating sunsets, Gardens.(忘れられない山の絶景、冬景色、魅惑的な夕日、庭園。)

A black and white photography in style of Mike Disfarmer, with stark white backgrounds, strong lighting signatures, minimalist. High-altitude mountain vista under winter overcast, damp moss textures on rough granite boulders range from Zone 1 shadows to Zone 7 highlights, sharp focal plane at f/11 on 8x10 large format, soft directional sunset diffusion creates long organic shadows across the damp wood garden structures, smooth highlight roll-off in the sky, organic creamy bokeh in the out-of-focus pine branches framing the frozen stone composition.(マイク・ディスファーマー風のモノクロ写真。真っ白な背景、力強いライティング、ミニマルな表現が特徴です。冬の曇天に覆われた高地の山々の景色。粗い花崗岩の岩に生える湿った苔の質感は、ゾーン1の影からゾーン7のハイライトまで変化に富んでいます。8x10の大判カメラでf/11の絞り値でシャープな焦点面を捉え、柔らかな夕日の拡散光が湿った木製の庭園構造物に長く有機的な影を作り出しています。空のハイライトは滑らかに減衰し、ピントの合っていない松の枝には、凍った石の構図を縁取るように、有機的でクリーミーなボケが生まれています。)

A black and white photography in style of Andreas Feininger, with high-contrast, silhouettes, high contrast. A large-format camera captures a winter mountain vista at sunset, the scene rendered exclusively in silver tonalities. The composition frames a dormant garden bed, where damp, textured stone walls form deep Zone 2 shadows contrasting against polished metal fixtures reflecting the dying light. A sharp focal plane isolates rough, frost-coated gravel while the out-of-focus background dissolves into smooth, creamy bokeh. The atmospheric luminance shifts from the hard edge of the setting sun, casting long, directional shadows across the wooden trellis, to the soft diffusion of the overcast sky. Absolute black defines the deepest crevices of the rock face, while pure white highlights roll off gently on the distant snow-capped peaks. The frame treats the non-human elements with cold, clinical detachment, documenting the physical weight of frozen water and weathered timber without human presence.(アンドレアス・ファイニンガー風のモノクロ写真。高コントラスト、シルエット、高コントラストが特徴です。大判カメラで冬の山の絶景を夕暮れ時に捉え、銀色のトーンのみで表現しています。構図は休眠状態の花壇を捉えており、湿った質感のある石壁がゾーン2の深い影を作り出し、磨き上げられた金属製の備品が消えゆく光を反射する様子と対照をなしている。シャープな焦点面が霜に覆われた粗い砂利を際立たせ、ピントの合っていない背景は滑らかでクリーミーなボケへと溶け込んでいる。大気の明るさは、沈む夕日の鋭いエッジが木製の格子に長く方向性のある影を落とすところから、曇り空の柔らかな拡散へと変化する。絶対的な黒が岩肌の最も深い亀裂を際立たせ、純白のハイライトが遠くの雪をかぶった山頂に優しく転がり落ちる。フレームは非人間的な要素を冷徹で臨床的な距離感で扱い、人間の存在を伴わない凍った水と風化した木材の物理的な重みを記録している。)

ただいま、景観や街頭のスナップを模したモノクロ写真風に画像を生成するためのモデルとして、FLUX.2 Klein 9B を使っている。ただ、これまで数百枚ほど画像を出してきた印象として、確かにクリアで高精細な画像を生成するのだけれど、何かこう耐え難く嘘臭い画像ばかり出てくる。そこで、プロンプトで描く粒度とプロンプト全体の分量が影響するのは分かっているので、ひとまずプロンプトの長さを変えて比較している。

上のテキストは、一段落ずつプロンプトとして入力し、それぞれの結果が添付した画像を上から並べた順番に対応している。ここで注意として、最初のプロンプトは僕が使っている「プロンプト生成スクリプト」を通していないソースのプロンプトであり、これをスクリプトに入力して、それぞれ二つ目と三つ目のプロンプトを得ている。なので、単純に最初のプロンプトを他の二つと比較するわけにはいかない。実際、スクリプトではモノクロ写真として画像を生成するように強制しているが、そういう強制をしていないので、当然ながら最初の画像はカラーで出ている。ということで、二つ目はスクリプトによって 100 words の長さへ変換したものであり、三つ目もスクリプトで 200 words の長さへ変換したものだ。それぞれ、Google Translate の翻訳を付けてある。

結論から言えば、プロンプトの長さを長くすれば「良い画像」になるとは言えない。そして、最初のプロンプトが短すぎて情報が不足していると、スクリプトでプロンプトを変換している Qwen 3.5 が適当にオリジナルの描写を加えてしまい、景観として山の絶景というメイン・テーマを忘れて、はっきり言ってどうでもいいような手前の石のディテールにこだわり始めてしまう。

では、ソースとなる最初のプロンプトがもっと長いテキストだったら、変換しても瑣事に拘らなくなるのか。試しに、

Underwater photography, Native American, mid-twenty, woman, Long hair, Mohawk hair, Caesar cut, Dirty Blonde hair, Hair chopsticks, Almond eyes shape, Blue eyes, Safety glasses, Round lips, Peach lips, Round with Soft Cheekbones face, Sunset eye makeup, Disgusted, Muscular body, Feminine pose, Eating, Cocktail dress, Soft light, Glare, Night, Dark clouds, urban concrete background, Alley background, Canon EOS RP, Crane shot, Diagonal angle.(水中写真、ネイティブアメリカン、20代半ば、女性、ロングヘア、モヒカンヘア、シーザーカット、ダーティブロンドヘア、ヘア箸、アーモンド型の目、青い目、安全メガネ、丸い唇、桃色の唇、柔らかい頬骨のある丸顔、夕焼けのアイメイク、嫌悪感、筋肉質な体、女性らしいポーズ、食事、カクテルドレス、柔らかな光、まぶしさ、夜、暗い雲、都会のコンクリートの背景、路地の背景、Canon EOS RP、クレーンショット、斜めの角度。)

をソースとして、これを 50 words へ変換した、

A black and white photography in style of Man Ray, Rayographs, with controlled lighting, minimalist studio elegance, cropped forms. Silver gelatin print captures a muscular, non-human figure with dirty blonde hair in chopsticks-style styling and Mohawk cuts against urban concrete alley textures. Deep exposure reveals soft cheekbones, almond-shaped lenses reflecting sunset eye makeup glare under dark clouds. Safety glasses rest on the frame while round lips form during eating motion. Long exposure on the Canon EOS RP produces creamy bokeh behind diagonal crane shot angles, highlighting the cocktail dress fabric grain through harsh directional shadows and highlight roll-off without chromatic data, emphasizing absolute black to pure white luminance zones in the wet urban atmosphere.(マン・レイのレイヨグラフを彷彿とさせるモノクロ写真。照明をコントロールし、ミニマルなスタジオのエレガンスとトリミングされたフォルムが特徴です。銀ゼラチンプリントには、都会のコンクリート路地のテクスチャを背景に、箸のようなスタイリングとモヒカンカットの汚れたブロンドの髪をした、筋肉質な非人間的な人物像が写っています。長時間露光により、柔らかな頬骨と、暗い雲の下で夕焼けのアイメイクの輝きを反射するアーモンド型のレンズが浮かび上がります。安全メガネはフレームにかけられ、丸い唇は食事の動きに合わせて形作られています。キヤノン EOS RP での長時間露光により、斜めのクレーンショットの角度の背後にクリーミーなボケが生まれ、色データなしで強い方向性のある影とハイライトのロールオフを通してカクテルドレスの生地の繊維が強調され、湿った都会の雰囲気の中で絶対的な黒から純粋な白の輝度ゾーンが強調されています。)

そして、更に

A black and white photography in style of Henri Cartier-Bresson, with blown highlights, high-contrast, gritty, grainy. The image is a large-format silver gelatin print of a non-human subject with muscular physicality captured against an urban concrete wall in a shadowed alley. The subject is framed from a high crane angle on a diagonal axis, utilizing a Canon EOS RP optical profile with a fast aperture to render deep shadow zones near absolute black and smooth highlight roll-off. The face displays soft cheekbones and round features under diffused night lighting, with round lips slightly parted as the mouth performs the act of eating. Almond-shaped eyes are partially obscured by glare from safety glasses, reflecting ambient dark clouds overhead. Long hair, styled in a chop cut and held by hair chopsticks, cascades down the shoulders. The dress is a cocktail style made of non-reflective fabric that absorbs the soft light. The composition maintains strict monochromatic integrity, describing the concrete texture through micro-contrast and the subject's form through the interplay of light and shadow. The background consists of dark clouds and urban concrete structures rendered in deep grays. The focal plane remains sharp on the subject's physique while the alley background dissolves into creamy bokeh. There are no human observers; only the physical weight of the stone and the subject's body are documented. The lighting reveals the contours of the body without chromatic interference, presenting a cold, observant view of the scene through a lens that captures only luminance and silver tones.(アンリ・カルティエ=ブレッソン風のモノクロ写真。ハイライトが飛び、コントラストが高く、ざらざらとした粒子感のある仕上がり。この写真は、薄暗い路地のコンクリートの壁を背景に、筋肉質な非人間的な被写体を捉えた大型ゼラチンシルバープリント。被写体は、斜め軸上の高いクレーンアングルからフレーミングされ、キヤノンEOS RPの光学プロファイルと高速絞りを使用することで、ほぼ完全な黒に近い深い影の部分と滑らかなハイライトのロールオフを実現している。顔は、拡散した夜間照明の下で、柔らかな頬骨と丸みを帯びた顔立ちを見せ、口は食事をしているかのようにわずかに開いている。アーモンド形の目は、安全メガネの反射光で部分的に隠され、頭上の暗い雲を映し出している。チョップカットにスタイリングされ、ヘア箸で留められた長い髪が肩に流れ落ちている。ドレスは、柔らかな光を吸収する非反射性の生地で作られたカクテルドレスである。構図は厳格なモノクロームの統一性を保ち、微細なコントラストによってコンクリートの質感を、光と影の相互作用によって被写体のフォルムを描き出している。背景は暗い雲と都市のコンクリート構造物で構成され、深い灰色で表現されている。焦点面は被写体の身体にシャープに捉えられ、路地の背景はクリーミーなボケに溶け込んでいる。人間の観察者は存在せず、石の物理的な重みと被写体の身体だけが記録されている。照明は色彩の干渉なしに身体の輪郭を浮かび上がらせ、光と銀色のトーンだけを捉えたレンズを通して、冷徹で観察的な視点からシーンを捉えている。)

という、それぞれ 50 words, 200 words へ変換したプロンプトで生成した画像を比較してみると、ちょっと意味の分からない光景なのだが、いちおう何がテーマであるかは外さずに描いているようだ。でも、やはり妙なディテールに拘って、描写している情景の全体においてリアリティを失っているような気がしてならない。これがベース・モデルをファイン・チューニングした人物の影響によるものなのか、それとも FLUX.2 Klein がもともと持っている特性なのかは分からないが、僕の使ってきた他のモデルと比較しても、やや「バタ臭い」画像が出てしまう傾向があるようだ。そして、むやみに画質がシャープになりすぎているようにも思う。ただ、生成された情景の多様性はあって、Z-Image Turbo や SDXL で出したときのようなワンパターンという印象は少ない。

  1. もっと新しいノート <<
  2. >> もっと古いノート

冒頭に戻る