オープンソースの人工知能(AI)を開発するOpenAIは9月25日、 対話型AI 「ChatGPT」 のアップデートで音声による対話と画像認識に対応すると発表しました。
これらの新機能は有料版の 「ChatGPT Plus」 と企業向け 「Enterprise」 プランのユーザーを対象としており、 発表から2週間以内にiOS・Androidアプリで利用可能になります。
声による会話が可能に

IMAGE BY OPENAI
新たに追加される音声機能はモバイルアプリから利用可能。 ユーザーが声で質問すると、 ChatGPTも回答を音声で読み上げ、 会話形式でやり取りが可能になります。 声色は5種類から選ぶことができます。
画像認識はブラウザ版も対応
画像認識はモバイルアプリとブラウザ版の両方から利用可能で、 撮影した画像と文字を組み合わせて質問するといった使い方ができます。
たとえば冷蔵庫の中身を撮影してChatGPTに送り、 夕食の献立を考えてもらったり、 取扱説明書と持っている工具の写真を送って、 組み立て方を教えてもらうといったシーンが想定されます。
Use your voice to engage in a back-and-forth conversation with ChatGPT. Speak with it on the go, request a bedtime story, or settle a dinner table debate.
Sound on 🔊 pic.twitter.com/3tuWzX0wtS
— OpenAI (@OpenAI) September 25, 2023
画像認識と音声回答のイメージ。 SOURCE BY OPENAI
OpenAIはこれらの機能を一般ユーザーにも順次開放していくとしており、 開発者利用を目的としたAPIの提供も考えられます。
調査会社のシミラーウェブによると、 ChatGPT(ウェブサイト)の月間訪問者数は8月まで3ヶ月連続で減少しています。 新機能を含めた今回のアップデートは、 利用数の増加につながるかもしれません。
SOURCE