オープンソース人工知能(AI)を開発するOpenAIは、 テキストから画像を生成するAIツール 「DALL・E」 の最新バージョンを発表しました。
新バージョン 「DALL・E 3」 は 「ChatGPT Plus」 と 「ChatGPT Enterprise」 のユーザーを対象に、 10月から提供が開始される予定。 今秋中にはAPIとLabs経由の提供も開始するとしています。
プロンプトの理解力が向上
「DALL・E(ダリ)」 はOpenAIが開発するAI画像生成モデルで、 テキストプロンプトから画像を生成できる(text-to-image)のが特徴です。
今回発表された 「DALL・E 3」 は、 2022年に公開された 「DALL・E」 の発展型。 従来モデルに比べて、 入力した文章をより忠実に絵画へと反映することが可能になったといいます。
IMAGE BY OPENAI
特に 「DALL・E 2」 でみられた 「長いプロンプトの一部がスルーされる」 問題が改善されており、 ニュアンスやディテールの理解力が大きく向上したといいます。
OpenAIによれば、 従来と同じプロンプトで生成しても、 旧バージョンと比較して画像のクオリティが向上しているとのこと。
IMAGE BY OPENAI
生成した画像の所有権については従来と同様ユーザーに帰属し、 転載・販売においてOpenAIの許諾は不要です。 近年問題になっているAI作品の著作権問題についても対策を行なっており、 存命するアーティストのスタイルを模倣するような画像リクエストは拒否する仕様になっていたり、 アーティストが自身の画像について今後の画像生成モデルのトレーニングに使用されないようオプトアウトが可能になっています。
また、 人権の安全対策として、 著名人の名前を含むリクエストは拒否するようになっているといいます。 OpenAIは安全対策のレッドチームを先日発表したばかりで、 各チームと連携しながら安全性を改善していくということです。
広告/Advertisement
ChatGPT上でネイティブに動作
「DALL・E 3」 は同じくOpenAIが提供するChatGPT上でネイティブに動作するのが特徴で、 ChatGPTと対話しながらよりイメージに近い画像へと修正することができます。
also, the video we made for dalle 3 is SO CUTE: pic.twitter.com/k1FOFTOsU5
— Sam Altman (@sama) September 20, 2023
これまでのAI画像生成ツールではプロンプトの特性や法則の理解に課題がありました。 DALL・E 3ではChatGPTと連携することで、 プロンプトを使わずに直感的な文章で画像を生成できるようになったのです。
DALL・E 3は 「ChatGPT Plus」 と 「ChatGPT Enterprise」 のユーザーを対象に、 10月から提供が開始される予定。 今秋中にはAPIとLabs経由の提供も開始するとしています。
SOURCE