生成AIを使った画像制作は、キーワードやフレーズが重要です。いわゆるプロンプトです。意外な画像が出てくるのは、楽しみではあります。しかし、アートな作品作りは別として、それでは、ビジネスでは使えません。
この先、食べ物や人物、機械などに特化した 生成AIが出てくるかもしれませんが、今は、この楽しくもやっかいなAIと付き合うしかありません。
そこで、今回思った通り、もしくはそれに近い画像の出し方を説明します。使用したのはChatGPT PLUS(有料版:月20ドル)で使えるDALL-E3です。
生成AIの画像制作は素材認識からはじめる
ChatGPT(DALL-E3)を使った画像生成で、これまででわかったことがあります。それは、New chatにしないと、それまで作成した内容に強い影響をうけること。これは文章生成やデータ分析、あるいはコード制作と同じ。つまり、その性質を利用して、認識のステップを積み上げながら最終目標に到達するのです。今回、テーマにしたのは、『さつまいもを素揚げした究極のさつまいもスイーツ』です。
生成AIに究極のスイーツを作成してもらう
世間ではさつまいもブームが起こっており、さまざまさつまいもスイーツが連日のようにSNSを賑わしています。見た目はさつまいもから脱却しているものもあり、一見してわからないスイーツもあるほどです。ここでは、シンプルながら自然の素材のみで作成したスイーツの再現を目指します。
生成AIに対象物を認識させる-さつまいもの画像生成
なにはともあれ、まずはイモの認識が大事だと次のようなプロンプトを作成して入力しました。
「皮を剥いたさつまいも」
出てきた画像は、外観こそ、さつまいもですが、人参のような断面であり、さつまいもとは程遠いもの。ひょっとしたら「海外ではさつまいもはこうなの?」と思い、次のプロンプトを入力しました。
日本のさつまいもでお願いします。
すると上の画像のようなさつまいもが出てきました。皮を剥いた、さつまいも、と判断して、剥いた皮とイモの断面なのでしょうか?背景の和室には言及せず、とりあえず、中はさつもいもぽっくはなりました。しかし、完全に剥いたわけではありません。そこで次のプロンプトです。
全ての皮を剥いたさつまいもを白いお皿に乗せて上から撮影してください
凹凸が多過ぎやしないかとおもいましたが、まあ、想定内なので、一発OKにしました。2枚出力したのですが、もうひとつは、何か芋虫みたいになっており破棄。そして次の調理に映ります。プロンプトは
このまま油で素揚げしたさつまいもを白いお皿の上に乗せて撮影してください。
丸ごと揚げてくれるかときたいしましたが、カットしてあげたようです。背景に演出が入ってきました。生成AIは、余計な影をつけたり、演出をしてくれます。これで「影が多いです」などと入力すると、影、多いに反応するのか、意図せぬ画像を出力します。英語のプロンプトを見ると否定しているのですが、単語をそのまま理解するのか、危険なプロンプトは避けます。言いたいことは、いろいろありましたが、次はシンプルなプロンプトにしました。
写真は真上から撮り直してください
少ない言葉で、他の意図も汲んでくれたのか、油や綿のような鍋敷きが消えています。確かに揚げたてなら熱いでしょうしから、AIの配慮ともいえます。しかし、それを細かく指示するとだんだん意図とズレた出力になってきます。さあ次は、いよいよ味付けのプロンプトです。
上からメープルシロップをかけて、もっと明るく撮影してください
なんか、メープルシロップがまわりに飛び散っている演出が入りました。商業写真ならありかもしれませんが、これは望んでいるものであありません。ごくシンプルな盛り付けです。そこで、ここは1回説明的なプロンプトをいれてみるかと考えました。
イメージ的に撮影せずに実際の食べ物として上からさつえいしてください。もう少し引きでお願いします。
しかし・・・。引きのアングルになって、周囲の空間が寂しく感じたのでしょうか、AIはお茶やこざら、食べかけのスイーツを配したのです。もう一度、否定形を反転させないように言葉に注意しました。
余計な飾り付けは一切不要です。テーブルの上の白いお皿にさつまいもの素揚げメープルシロップがけだけがある写真
わるくはないのですが、イモ感がなくなり、アングルも斜め上になっています。そして、修正のプロンプトを次のようにしました。
真上から撮ってください。芋はボリュームアップ
確かにボリュームアップしましたが、メープルシロップの容器が中央にありますし、ナプキンのようなものも右上にあります。改めて説明的なプロンプトで挑戦しました。
白い皿、メープルシロップをかけたさつまいもの素揚げ、ボリューム、真上から撮影、他に何もなく、ただ明るいだけの写真。
意図した構図に近づいていますが、何か違うスイーツに変わってゆく気配がただよいます。そこで、少し方向性の違う画像を生成しようと思いつきました。画像生成がブレてきたら箸休め的なプロンプトを入れることでうまくいったことがあったからです。入れたプロンプトは・・・
究極の大学芋を美味しそうに眺めている大学生の写真
ふーむ。まあ、何かわからないですね。そこで、まとめる意味もこめて、次のプロンプトを投入しました。
さつまいもを素揚げしてメープルシロップをかけた、究極のさつまいもスイーツの写真を真上から撮影。背景は白の綿のテーブルクロス(影なし)
路線が直ったかなと思いますが、飛び散るメープルシロップや綿の質感をだそうした演出が入ります。それで、方向性を変えるためにプロンプトを入力しました。
背景はグリーンにしてください。皿以外はメールシロップを落とさないように
確かにグリーンにはなっていますが、綿の質感がのこっています。シロップをこぼした演出もひとつでは再現されています。で、ここで光をいれて、消しとばすプロンプトにしました。
左右、前後、上から淡いストロボを使った画像にしてください。切り抜きでつかえる平坦な緑色の背景にしてください。
ここできたのが、上記の写真です。比較的、想像していたイメージに近い画像になりました。これでめでたし、めでたしです。
これまでの過程を一つにしたプロンプトでの出力
素材や調理方法、背景、光の加減、使用目的など一つのプロンプトで出力してみました。
皮を剥いたさつまいもを素揚げしてメープルシロップをかけた究極のさつまいもスイーツの写真。白いお皿の上に乗っています。撮影は真上からで横長背景は緑で、左右、前後、上から淡いストロボを使った画像にしてください。切り抜きでつかえる平坦な緑色の背景にしてください。
それで出した画像が次の2つの写真です。
一発目で、このプロンプトにしてればよかったのですね。しかし、なぜかイメージとは離れています。そこで、もうひとプロンプト。
緑はもっと濃くシンプルに。皿が切り抜きできるように。さつまいもとわかるようにディテールを演出してください。
この感じは、いいですね。背景が濃過ぎますが、ディテールもサツマイモっぽいです。
まとめ
自分の思った画像を生成AIで作るにはステップ方式が一つの方法であること。イメージはある程度最初に作っておき、それに向かって改良のプロンプトをいれること。
・プロンプトは演出範囲を限定する
・邪魔な演出がはいったら、切り抜き使用にして対象物だけにする
・ディテールはプロンプトで伝える
以上、サツマイモスイーツの完成を例にとり、生成AIで思った通りの写真に仕上げる手順を説明しました。