生成AIであるChatGPTは今やビジネスシーンでも利用されることがあるほどのツールとなりました。
その利便性は日に日に向上しており、中にはChatGPTで画像生成ができないかと検討されている方もいるでしょう。
この記事では、そんなChatGPTを利用した画像生成の可否や有効活用の方法についてご紹介します。
目次
ChatGPTで画像生成ができる!
結論から言いますと、ChatGPTで画像生成は可能です。
以前まではChatGPTで画像生成は不可能でしたが、2023年9月21日に新しくリリースされた画像生成AIの登場により可能となりました。
有料プランのみ利用可能
ChatGPTで画像生成を利用するには、現状ではChatGPTの有料プランでのみ利用できるGPT-4が使用できる状態である必要があります。
このGPT-4は以下の3プランのいずれかを契約している必要があります。
- GPT-Plus:20ドル/月
- GPT-Team:25ドル/月
- ChatGPT Enterprise:お問い合わせ対応
DALL-Eを使って画像を生成(補足あり)
ChatGPTの有料プランで利用できるGPT-4ではDALL-Eという機能を利用できます。このDALL-Eこそが、ChatGPTで画像生成を行うための機能となります。
DALL-EはOpenAI社からリリースされた画像生成AIで、ChatGPT上でプロンプトを送信することで、その場で画像生成を行うことが可能です。
このDALL-Eシリーズは以前より存在しており、ナンバリングが進むにつれて性能も飛躍的に向上しました。
優れた 理解力 | プロンプトから細かなニュアンスまでを理解することができる |
ChatGPT 上で完結 | ChatGPTとの統合が可能になり、ChatGPT上で画像生成を完結させられる |
悪用防止 | フェイクニュースへの悪用など、公人などの名前を含むプロンプトを拒否できる |
クリエイティブ コントロール | 著作権侵害対策で、存命アーティスト関連のリクエスト拒否といったクリエイティブコントロールが備わっている |
別途費用は不要
このDALL-Eはビジネスシーンで活用できる職種の方であれば、有料ツール以上の価値がある機能ですので、利用する上での金額に不安を覚えるかも知れません。
しかし、DALL-EはあくまでもChatGPTの有料プラン内の機能という立ち位置にありますので、ChatGPT有料プランにかかる費用以外には追加で支払いが発生することはありません。
従量課金制でもありませんので、気兼ねなく利用することができます。
※MicrosoftのBing Image Creatorに関しては商用利用不可である代わりに、ChatGPT費用も不要でBing上で利用できます。
ChatGPTのDALL-Eを使って画像生成を行う方法
それでは、ここからはChatGPT上でDALL-Eを使って画像生成を行う方法についてご紹介します。
なお、ChatGPT自体のアカウント登録や有料プランの申込に関しては既に済ませた状態からの方法をご紹介しますので、これからアカウント登録を行うという場合は以下の記事をご覧ください。
DALL-Eによる画像生成の手順
ChatGPT上でDALL-Eを使って画像生成を行う方法は非常に簡単です。
有料プランのChatGPTを契約している場合、GPT-4とGPT-3.5を選択できる状態ですので、まずはGPT-4を選択してチャットを開始します。
あとは、プロンプトに生成して欲しい画像の特徴を入力して「~という画像を生成して。」と送るだけでDALL-Eによる画像生成が開始されます。
実際にDALL-Eを使ってみた
論より証拠ということで、実際にDALL-Eを使って画像生成を行ってみました。
プロンプト1
「KAGOYA」というテキストを派手に演出した画像を生成して。サイズは1000×400ピクセル。PNG形式で作って。
プロンプト2
ChatGPTを使って画像生成している様子の画像を作成して。サイズは1200×630ピクセル。PNG形式で作って。
待ち時間は数十分は覚悟していましたが、実際のところは1分も掛からず20秒ほどで上記のような画像を生成させることができました。
もちろん複雑なプロンプトにすれば画像生成までにかかる時間も長くなりますので、一概に「待ち時間は短い」とは断言できません。
※プロンプトでPNG形式を指定していますが、この記事を作成している時点ではDALL-EではPNG形式のみの生成となります。
DALL-EをAPIで利用も可能
ChatGPTのDALL-Eによる画像生成はChatGPT上で完結させることができますが、API連携により他の場所からプロンプトの送信、画像の抽出を行うことも可能です。
ただし、そのためにはOpenAI公式サイトからシークレットキーの発行等の作業が必要になります。
APIによるChatGPTの使い方に関しては以下の記事でご紹介しておりますので、ChatGPT以外の場所から画像生成されたい場合は以下の記事をご参照ください。
ChatGPT APIとは|料金や使い方、注意点について解説
オープンAIであるChatGPTをフル活用しようと思うと、「API」の存在が必要になるケースがほとんどです。 しかし、人によってはこのAPIという言葉に対して馴染みがないという方も一定数いるかと思いますので、この記事ではChatGPTのAPIについてご紹介します。 単にChatGPT APIの役割や特徴の紹介だけではなく、実際に利用する場合の方法や注意点なども併せてご紹介します。 ChatGPT …
DALL-Eを効率的に使うコツ
DALL-Eでの画像生成の方法に関しては、ここまでに紹介した内容であらかた把握できたかと思います。
しかし、この機能を使った画像生成では、事前に知っておくことでより効率的に活用できるコツもありますので、こちらも併せてご紹介します。
プロンプトは英語を推奨
ChatGPTは日本語対応ですので、プロンプトも日本語で記入・送信が可能です。
しかし、日本語対応しているとはいえ、得意言語は英語となりますので複雑な注文をしたい場合には英語のプロンプトを送った方が指示に正確に答えてくれます。
とはいえ、そこまで流暢に英語のプロンプト作成が可能な日本人は少ないと思いますので、そういった場合は一旦日本語でプロンプトを作成し、それをChatGPTに英語に翻訳させ、翻訳した英文プロンプトで画像生成を依頼することで、より正確な画像生成が可能となります。
その際、プロンプトは1つの文章に全てを詰め込むのではなく、いくつかの文章に分けてプロンプトを作成すると、ChatGPT側でも正確に理解しやすくなります。
データ形式やサイズ等について
DALL-Eで生成が可能な画像には、以下のようにいくつかの制約があります。
画像のデータ形式 | PNG形式のみ |
画像のサイズ | 以下の3つのサイズでのみ生成可能 ・1024×1024ピクセル ・1792×1024ピクセル ・1024×1792ピクセル |
なお、画質に関しては特に制限はなく、高画質な画像だったり低画質な画像といった注文を付けることができます。
また画像生成が可能な回数についても制限はありません。しかし、一般利用の範疇を越えてChatGPT側に過度な負荷がかかるような無茶なプロンプトを連投すると、制限が適用されることがあります。(ChatGPT回答)
ただし、この辺りも近いうちに対応可能なデータ形式やサイズも増えてくる可能性がありますので、定期的にチェックは必要です。
追加プロンプトで調整する
上記でご紹介の通り、基本的には画像生成の回数制限はありませんので、生成された画像で修正して欲しい部分があれば、続けて追加のプロンプトを送信して調整させることも可能です。
- 「子犬の画像を生成して」とプロンプトを送信
- 白背景の子犬の画像が生成
- 続けて「黒背景にして」とプロンプトを送信
- 黒背景の子犬の画像が生成される
なお、プロンプトを続けて送信することは可能ですが、追加で送信したプロンプト以外も変更されてしまうため、プロンプトの内容は工夫する必要があります。
DALL-Eの画像生成に関する注意点
DALL-Eによる画像生成は時短や画像素材購入費用の節約という面で、かなりの効果が期待できる機能ですが、その反面で注意が必要な側面もあります。
日本語が苦手
前述でも少し触れていますが、DALL-EはChatGPTと同様に日本語が得意ではありません。
ここでいう「得意ではない」というのはプロンプトに関することだけではなく、生成する画像内に入れるテキストに関しても言えます。
以下は実際に記事のアイキャッチの作成が可能か試した際の様子となります。
「ChatGPTで画像生成が可能に!」という記事のアイキャッチを作成して。サイズは1200×630ピクセル。PNG形式で作って。
このように、日本語のプロンプトを送信していますが、生成された画像は英語表記となっています。
この画像に対して、続けて以下のように日本語にするようプロンプトを送信します。
テキスト部分は日本語でお願いします。
すると、このように何語なのか原型も分からない画像が返ってきました。
このように、ChatGPTのDALL-Eによる画像生成では、日本語のテキストを画像内に反映させることが現状では不可能に近いので、画像内に日本語テキストを入れたい場合はその部分のみ人の手で加筆する必要があります。
ChatGPTのDALL-Eは商用利用が可能
ChatGPTのDALL-Eで生成した画像については著作権は自分のものになり、再印刷、販売、商品化を含む商用利用も可能となります。
そのため、自分のSNSアイコンなどをDALL-Eを使って作成したり、自社のマスコットキャラを作成させて、そのキャラをデザインした商品を販売することも可能です。
他にもラインスタンプを作成して販売することも可能ですので、デザインが苦手な方であってもビジネス利用が容易にできるようになります。
ただし、このDALL-Eという画像生成の機能はChatGPTだけではなくMicrosoftのBing Image Creatorも利用でき、Bing Image Creatorで生成した画像に関しては商用利用は不可となっています。
まとめ
少し前まではChatGPTでは難しいと言われていた画像生成もDALL-Eという画像生成AIの登場により、割と早い段階で可能となりました。
この機能を有効活用できれば、日常のクリエイティブな作業だけではなく、ビジネスシーンでも大いに役立てることができます。
費用としてもDALL-E自体は無料となっていますので、ChatGPTの有料プランのみで利用できますので、月に20ドル/月とコスパとしてもかなり優秀な機能と言えるでしょう。
この記事でご紹介している画像生成例以外にもアイコンやイメージ図の作成など、まだまだ多くのジャンルの画像生成に活かせますので、一旦触ってみたいという場合はChatGPTのアカウント登録も不要なBing Image Creator(商用利用不可)で試してみるのもいいでしょう。
他にもChatGPTやAI、IoT関連の記事も掲載しておりますので、興味がございましたら一度ご覧ください。
開発・検証・プログラミング学習に。無駄なコストもかけたくないあなたにおすすめのVPS
カゴヤのVPSは初期費用無料でアカウント登録さえしておけば、必要なときだけ日額課金でサーバーを立ち上げ可能!料金は使った分だけ。