画像生成AIで画像を生成するには、期待しているイメージをプロンプトという形で言語化し、画像生成AIに入力します。この言語化(プロンプト作成)がなかなか難しい。プロンプトは英語で記述しなければならず、これまで全く使ったことない、いわゆるビジネス英語で使わないような英単語を探さねばなりません。英文学に触れたこともない私にはこれが厳しい。じゃ、ChatGPTに作ってもらおうということでトライしてみました。
下が最初にChatGPTに入力した指示です。
あなたは画像生成AIで画像を生成するエキスパートです。そのスキルを活用し、私がStable Diffusion web UIを使って画像を生成するためのプロンプト作成のサポートをしてください。サポートを提供するに当たって以下のルールに従ってください。
ルール:
・プロンプトは英語で作成してください。
・一つのプロンプトは、一つの英単語、または、複数の英単語からなるセンテンスで構成してください。
・プロンプトは、カンマで区切ってください。
・プロンプトは重要度の高いものを先に、重要度の低いものを後ろにしてください。
・必要であればプロンプトに0.1~1.9の間で重み付けをしてください。
ChatGPTからがんばりますとのreplyが表示されたので、こんな文章を入力してみました。
深い森の中に日本人の女性がいる。女性は魔女です。女性は手に太く長い杖を持ち、擦り切れたマントを着ています。時刻は夕方です。
こんなプロンプトが提示されました。
"Generate an image of a deep forest with a Japanese woman who is a witch. The woman is holding a thick, long staff in her hand and wearing a worn-out cloak. It's dusk."
上の二重引用符を外し、ピリオドをカンマに置き換え、前後に画質、光源のプロンプトを追加して作成した画像が以下です。
なかなかいい感じです。プロンプトの加工が面倒なので以下のChatGPTに以下の指示を追加しました。
二重引用符で囲まないでください。.の代わりに,を使用してください。先頭のGenerate an image ofの指示の語は不要です。
そうしたら日本語でプロンプトを返してきやがりました。そこで「プロンプトを作成してください」と指示したところ、次のプロンプトが作成されました。
"Deep forest, Japanese woman, skilled sorceress, holding a thick, long staff, wearing a worn-out cloak, dusk."
どうにも二重引用符で囲むのと文末のピリオドは譲れないようです。なかなか言うことをきいてくれない。ちょっと諦めて次を与えてみました。
深く暗い森の中に、日本人の若い女性が魔法使いとして立っています。女性は太く長い杖を手に持ち、擦り切れたマントを身にまとっています。そのマントには壮麗な刺繍が施されており、時刻は夕暮れです。
生成されたプロンプトとそれを元に作成した画像が以下です。
"Deep, dark forest, young Japanese woman, skilled sorceress, holding a thick, long staff, wearing a worn-out cloak adorned with magnificent embroidery, dusk."
もう少し使い込むとよくなっていきそうです。
コメント