オープンソース人工知能(AI)を開発するOpenAIは、 テキストから画像を生成するAIツール 「DALL・E 3」 を発表しました。
新バージョン 「DALL・E 3」 は 「ChatGPT Plus」 と 「ChatGPT Enterprise」 のユーザーを対象に、 10月から提供が開始されています。 本記事では、 ChatGPTとDALL・E 3を活用したAI画像生成の利用法を解説します。
ChatGPT
OpenAI無料posted withアプリーチ
ChatGPTとは
ChatGPTは、 米・OpenAIが2022年11月に公開したAIチャットボット、 およびサービスの名称です。 グーグルが2017年に公開したTransformerをベースに、 OpenAIが開発した文章生成モデル 「GPT(Generative Pre-trained Transformer)」 を用いています。
大量のテキストデータを学習することで言語のパターンや文脈を理解し、 人間のように自然な文章を生成できるのがGPTの特徴。
ChatGPTはGPTモデルを対話型の環境に特化させたサービスであり、 カスタマーサービスのチャットボットなど、 ユーザーとの会話を通して自然な文章を生成できるツールとして活用されています。
広告/Advertisement
ChatGPTの新機能 「DALL・E 3」 とは
「DALL・E(ダリ)」 はOpenAIが開発するAI画像生成モデルで、 テキストプロンプトから画像を生成できる(text-to-image)のが特徴。
DALL・E 3は2022年に公開された 「DALL・E」 の発展型で、 従来モデルに比べて入力した文章をより忠実に絵画へと反映します。
入力 An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula (星雲の爆発のように描かれた、 バスケットボール選手のダンクを表現した油絵)
DALL・E 3は同じくOpenAIが提供すChatGPT上でネイティブに動作するため、 ChatGPTと対話しながらよりイメージに近い画像へと修正することができます。
これまでのAI画像生成ツールではプロンプトの特性や法則の理解が課題でしたが、 DALL・E 3ではChatGPTと連携することで、 プロンプトを使わずに直感的な文章で画像を生成できるようになっています。
「DALL・E 3」 の特徴
1. 高解像度の画像生成
DALL·E 3は、 高解像度の画像を生成する機能を搭載したことにより、 よりクオリティの高い画像を作り出せます。 従来のシリーズよりも、 詳細なテクスチャやより複雑なシーンを再現できるようになりました。
2. テキストベースの指示に従った画像生成
DALL·E 3は、 具体的なテキストプロンプトに基づいて、 合致する画像を生成できます。 アンニュイな表現はもちろん、 ユーザーが描いている抽象的なイメージやアイデアを具現化できるように進化しました。
さらに、 特定のスタイルやテーマに基づいて画像生成できるのもDALL·E 3の大きな特徴です。 プロンプトで 「水彩画」 など、 イメージするスタイルを指定することで、 それに合わせた画像を生成してくれます。
3. 高い安全性
DALL·E 3は、 暴力的な画像をはじめ、 成人向け、 憎悪的なコンテンツの生成を制限していることから、 高い安全性が担保されているのも特徴です。 フェイクニュースや、 実在する人物の名前を含むリクエストを拒否するように対策が進められています。
4. クリエイティブコントロール
DALL·E 3で生成した画像の所有権は、 全て作成したユーザーにあります。 そのため、 OpenAI社の許可なく転載や販売などの商品利用が可能です。
ただし、 既存の作品における著作権侵害のリスクを避けるために、 リクエスト内容によって生成を拒否するよう設計がされています。
5. 連続的な画像変化の生成
DALL·E 3は、 特定の画像から少しずつ変化を加えられるのも大きな特徴です。 そのため、 アニメーションの作成はもちろん、 変化の過程を表現するための画像生成も容易に作成できます。
広告/Advertisement
ChatGPTで 「DALL・E 3」 を使う方法
ここからは、 ChatGPT上で新機能・DALL·E 3を使う方法を解説します。
まずは、 お使いのデバイスでChatGPTを開き、 GPT-4を選択します。
GPT-4のメニューに DALL・E 3と表示されていたら、 導入済みであることを示しています。
DALL・E 3をクリックしてください。
あとは通常通り、 メッセージボックスにプロンプトを入力するだけでOK。 プロンプトに合わせた画像を自動生成してくれます。
試しに次の文章をプロンプトとして入力したところ、 およそ1分で次のような画像が生成されました。
入力 ハーフパイプをしている少年、 晴天、 観客がたくさんいる、 スキー場、 背景に太陽が見える
出力
しかし、 筆者が思い描いていたのは 「スキー」 ではなく 「スノーボード」 をしている少年だったため、 次のようにプロンプトを追加すると…
入力
出力
きちんとプロンプトの内容を反映し直して画像が生成されました! 絵のタッチまで指示をしていないため、 様々なスタイルのイラストが描かれています。
生成された画像が全て1対1の比率だったため、 異なる比率で画像を生成できるか質問してみました。
2023年10月時点では、 次の3つの形式から画像比率を選択できるようです。
- 正方形 (1,024×1,024)
- 横長 (1,792×1,024)
- 縦長 (1,024×1,792)
今回は、 横長で生成し直してもらうようリクエストしてみました。
このように、 横長の比率の画像を生成し直してくれました。
DALL·E 3を使用する際の注意点
DALL·E 3を使用する際の注意点をいくつかご紹介しましょう。
ChatGPT上で使用する場合は有料会員への登録が必要
ChatGPT上でDALL·E 3を使用する際は、 有償サービスへの登録が必要です。 有料版の 「ChatGPT Plus」 に加入するためには、 月額20ドルがかかります。
ChatGPT Plusに加入することで、 次のように機能が拡張されます。
ChatGPT | ChatGPT Plus | |
---|---|---|
料金 | 無料 | 20ドル(約2,600円)/月 |
ベース |
|
|
特徴 |
|
|
|
OpenAIのリリースを元に作成
レスポンスの速さを重視する方はもちろん、 反復的なルーティンワークを自動化させたい方にもおすすめです。 最新機能のDALL·E 3を利用するためにも、 ChatGPT Plusの加入を検討してみましょう。
一部利用できないユーザーも存在する
2023年10月上旬より、 順次展開しているDALL·E 3ですが、 一部のChatGPTユーザーはいまだに利用できない状態となっています。
ただし、 DALL·E 3はChatGPTだけではなく、 BingブラウザやBing Image Creatorでも利用可能です。 ChatGPTで使えない方は、 これらのサービスを活用して、 DALL·E 3の機能性を体感してみましょう。
なおBing AI上やBing Image CreatorでDALL·E 3を使用する場合、 ChatGPTとは異なり商用利用ができません。 そのため、 商用として使いたい場合は、 ChatGPT Plusへの加入が必須です。 Bing AI上やBing Image Creatorで生成した画像を販売する行為は避けてください。
広告/Advertisement
まとめ
2023年10月より順次展開しているChatGPTの新機能 「DALL·E 3」 についてくわしく解説しました。 テキストプロンプトによって高解像度の画像を自動生成できる便利な機能として世界中から注目されています。
以前のバージョンよりも格段に性能が上がっており、 使い勝手も良いことから、 様々な用途で活用できる機能と言えるでしょう。 生成した画像を商用利用したい方は、 ぜひ有料会員であるChatGPT Plusへの加入を検討してください。
ChatGPT
OpenAI無料posted withアプリーチ
SOURCE