BECOME A MEMBER

SEEKERS

ガジェット・モノ好きが集う情報共有プラットフォーム。モノやサービスのアイデアを、 記事にして共有しよう。

New Post

AI

グーグル、 マルチモーダルAI 「Gemini」 を発表。 処理能力を大幅強化、 Pixel 8 Proへの導入も予定

グーグルは12月7日、テキスト・画像・音声・動画など複数のデータ形式を理解し、利用できる新しいAIモデル「Gemini」を発表しました。チャットAI「Bard」(英語版)ではすでにGemini Proが利用可能で、2024年度中にはGemini Ultraを用いた「Bard Advanced」もリリース予定です。

Pick Up

Application

「手書きノートアプリ」 の方向性は? 「Noteshelf for Mac」 の特徴まとめ

Mac Catalystの恩恵を受けてついにリリースされた「Noteshelf 2」のMac版をしばらく使ってみました。「Noteshelfを既に使っている人」からすれば待望のMac版ということでメリットも大きいですが、「PC向けの標準ノートアプリ」としてはまだまだ改善点の多い、そんな仕上がりになっています。
Product

アップル、 MRヘッドセットを年内に発表との噂。 ARグラスは技術的課題を理由に延期か

アップルのMRヘッドセットは、メタのVRヘッドセット「Quest Pro」の対抗馬になるとみられています。年内にも第一弾となる製品を発表し、2024年以降には廉価グレードを追加で投入される見込みです。一方、兼ねてより開発が伝えられていたARグラスについては、技術的課題から発表延期が報じられています。

IMAGE BY OPENAI

AI

AI画像生成ツール 「DALL・E 3」 発表。 ChatGPT上でネイティブ動作、 直感的な画像生成と修正が可能に

OpenAIは、 テキストから画像を生成するAIツール「DALL・E」の最新バージョンを発表しました。新バージョン「DALL・E 3」は「ChatGPT Plus」と「ChatGPT Enterprise」のユーザーを対象に、 10月から提供が開始される予定。 今秋中にはAPIとLabs経由の提供も開始するとしています。
サイト内の外部リンクはアフィリエイト広告を含む場合があります (詳細

オープンソース人工知能(AI)を開発するOpenAIは、 テキストから画像を生成するAIツール 「DALL・E」 の最新バージョンを発表しました。

新バージョン 「DALL・E 3」 は 「ChatGPT Plus」 と 「ChatGPT Enterprise」 のユーザーを対象に、 10月から提供が開始される予定。 今秋中にはAPIとLabs経由の提供も開始するとしています。

プロンプトの理解力が向上

AI画像生成ツール   「DALL・E 3」   発表。   ChatGPT上でネイティブ動作、   直感的な画像生成と修正が可能に

IMAGE BY OPENAI

DALL・E(ダリ)」 はOpenAIが開発するAI画像生成モデルで、 テキストプロンプトから画像を生成できる(text-to-image)のが特徴です。

今回発表された 「DALL・E 3」 は、 2022年に公開された 「DALL・E」 の発展型。 従来モデルに比べて、 入力した文章をより忠実に絵画へと反映することが可能になったといいます。

AI画像生成ツール   「DALL・E 3」   発表。   ChatGPT上でネイティブ動作、   直感的な画像生成と修正が可能に

IMAGE BY OPENAI

特に 「DALL・E 2」 でみられた 「長いプロンプトの一部がスルーされる」 問題が改善されており、 ニュアンスやディテールの理解力が大きく向上したといいます。

OpenAIによれば、 従来と同じプロンプトで生成しても、 旧バージョンと比較して画像のクオリティが向上しているとのこと。

入力 An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula (星雲の爆発のように描かれた、 バスケットボール選手のダンクを表現した油絵)

DALL・E 2
AI画像生成ツール   「DALL・E 3」   発表。   ChatGPT上でネイティブ動作、   直感的な画像生成と修正が可能に
DALL・E 3
AI画像生成ツール   「DALL・E 3」   発表。   ChatGPT上でネイティブ動作、   直感的な画像生成と修正が可能に

IMAGE BY OPENAI

生成した画像の所有権については従来と同様ユーザーに帰属し、 転載・販売においてOpenAIの許諾は不要です。 近年問題になっているAI作品の著作権問題についても対策を行なっており、 存命するアーティストのスタイルを模倣するような画像リクエストは拒否する仕様になっていたり、 アーティストが自身の画像について今後の画像生成モデルのトレーニングに使用されないようオプトアウトが可能になっています。

また、 人権の安全対策として、 著名人の名前を含むリクエストは拒否するようになっているといいます。 OpenAIは安全対策のレッドチームを先日発表したばかりで、 各チームと連携しながら安全性を改善していくということです。

ChatGPT上でネイティブに動作

DALL・E 3」 は同じくOpenAIが提供するChatGPT上でネイティブに動作するのが特徴で、 ChatGPTと対話しながらよりイメージに近い画像へと修正することができます。

これまでのAI画像生成ツールではプロンプトの特性や法則の理解に課題がありました。 DALL・E 3ではChatGPTと連携することで、 プロンプトを使わずに直感的な文章で画像を生成できるようになったのです。

DALL・E 3は 「ChatGPT Plus」 と 「ChatGPT Enterprise」 のユーザーを対象に、 10月から提供が開始される予定。 今秋中にはAPIとLabs経由の提供も開始するとしています。

  SOURCE