■Gemini による生成画像
●何か失敗した少女

これは作り置きのキャラ画像を4枚アップロードして,
「アニメスタイルの画像を作ります。赤い服の少女がテーブルの前に座り,テストの答案用紙のような紙を両手で持っています。少女は唇を半開きにして眉を下げ,悲しんでいる様子です。少女の脇に紺色の服の女性が立ち,少女の座る椅子の背もたれに手をついています。紺色の服の女性は少女の持つ紙を見下ろし,心配そうな表情をしています。少女と女性の背後,少し離れた場所に窓があり,窓のそばに軍服姿の青年が立っています。青年は左手を顎に当て,右手を腰に当て,俯いています。何か悩んでいる雰囲気です。テーブルにはフラスコ,アルコールランプ,乳鉢,ハーブの入ったカゴがあります。室内には本棚があり,天井からドライフラワーが吊るされています。」
……と,入力して出来たもの。
Gemini のプロンプトの長さの限界ってどれくらいなんだろう。
よくこんな長い指定でそれっぽい絵を作るもんだと感心した。
実はこの画像を作る前にも一枚,似たような指定の画像を作ったが,軍人姿の青年役に別の画像を使ったら,なぜか勝手に真ん中分けにされてしまい,ポーズが面白くなかったので没にした。ただその画像の方が「少女の周辺」の描写は良かった。
また,画像4枚添付とプロンプトを同じにして,ChatGPTに依頼してみたところ,このような画像になった。
キャプションは「試験の結果に落ち込む少女」になった。
ChtGPT は Gemini の画像を自前のアニメタッチで描き直すことがわかった。
この構図,当初希望していたものに近いが,青年の大きさが遠近感的におかしい気がする。
Gemini の画像出力が正方形,ChatGPT が長方形ということが生成に影響しているのかもしれない。
Copyright (C) 2026 S. Sonohara, All rights reserved.
