Googleの生成AIであるGeminiは画像生成を行うことができます。画像の生成にはImagen 3というモデルが使用されます。この画像生成は無料版のGeminiでも使用できるので、そのやり方や制限について紹介します。
Geminiとは
Geminiとは、Googleが開発したマルチモーダル生成AIモデルです。
文章、画像、音声、動画を入力として受け取り、文章と画像を生成できます。
画像生成のやり方
“Geminiに相談”と書かれた入力欄に、”〇〇のが画像を生成して”見たいな文章を入力してください。
画像生成AIのImagen 3で生成が始まります。
問題なければ、”はい、どうぞ。”と言われて画像が1枚生成されます。
画像の右上のところにカーソルを合わせると、”フルサイズでダウンロード”と出るので、押せば画像をダウンロードできます。
同じプロンプトで画像生成したい場合は画像下になる再生成のボタンを押せばできます。
画像生成の制限
回数制限
無料版では、数10回やるとその日は生成ができなくなり、次の日になるとまたできるようになります。
表示される文章にはパターンがあるようです。
申し訳ありませんが、今日はこれ以上画像を生成できません。明日またリクエストしてください。
今日はこれ以上画像を作成できません。ウェブから画像を探すことは引き続き可能です。
生成内容の制限
無料版のGeminiでは人物画像の生成が制限されています。
生成しようとすると以下のメッセージが表示されます。
まもなく Gemini Advanced で人物の画像生成を利用できるようになります。
メッセージにあるように、有料版なら人物の画像生成を行うことができます。
ガイドライン
ガイドラインに違反する画像は生成することができません。
特定の種類の画像を生成する方法についてはまだ学習中のため、ご希望のものを正確に作成できないかもしれません。また、ガイドラインに違反する画像を生成することもできません。他にご要望があればお知らせください。
画像の入力
プロンプトの入力欄の左のボタンから画像をアップロードできます。
画像がアップロードされた状態で、プロンプトで”この画像を簡潔に説明して”と入力すると、回答が返ってきます。
この画像を拝見しました。この画像は、擬人化された猫、つまり人間の姿をした猫を描いていますね。特に目立つ点を以下にまとめます。
- 服装: 黒いドレスと帽子を身に着けています。ドレスはレースやフリルで飾られており、帽子には花のような装飾が付いています。全体的にフォーマルで、どこかミステリアスな雰囲気を醸し出しています。
- 猫の顔: 猫の顔はリアルな猫の顔と人間の顔の特徴を組み合わせています。黄色い目、白いひげ、ピンクの鼻など、猫の特徴がよく出ています。
- 背景: 背景は単色の水色で、猫の姿が際立つようになっています。
全体的に、この画像は猫の優雅さや神秘性を表現していると言えるでしょう。擬人化されていることで、どこか人間的な感情や物語性を感じさせる作品ですね。他に気になる点や、さらに詳しく知りたいことがあれば、遠慮なくお尋ねください。
プロンプトについて
画像を生成した後に、次のプロンプトで”ドット絵にして”と入力すると、前回のプロンプトを踏まえてドット絵にしてくれます。前回のプロンプトで生成した画像そのものがドット絵になってはいなかったので、あくまで前回のプロンプトが考慮されている感じです。
まとめ
無料版のGeminiでは制限はありますが、工夫次第で十分活用できると感じました。
コメント