ChatGPTに画像認識と音声認識と発話機能が有料版などに搭載

「ChatGPT Plus」や「ChatGPT Enterprise」の契約者が画像認識・音声認識・発話機能を利用できるように約二週間で変更されるとの事です。Bingはスマホのアプリで音声認識と発話機能は利用可能でしたが果たしてどれほどか。

ChatGPTの場合は利用者が多いですから、有名声優等による音声データを用いた音声会話は収益化の可能性が高いのでは。そのような中から面白い音声チャットのコミュニケーションは進化していくのかもしれません。

画像認識については例えば、自転車の写真と問題解決の為にChatGPTへ質問した内容は自転車の型番と形状等から正しい問題解決方法に素早くたどりつけそう。自転車の型番は確認に時間がかかる事もありますから有為な機能と思います。

Google AIの大規模言語モデル「Bard」(ベータテスト中)のチャットログ。
Googleによる説明ブログ記事リンク Google Japan Blog: AI の次の重要な一歩
Bardに、上記の三段落文章を質問した場合の応答

Bardの応答を引用
ご指摘の通り、画像認識・音声認識・発話機能の追加は、ChatGPTの利用者にとって大きなメリットとなるでしょう。

音声認識・発話機能については、Bingのアプリでも利用可能でしたが、ChatGPTの場合は利用者が多いため、収益化の可能性が高いと考えています。有名声優等による音声データを用いることで、より自然で臨場感のある音声会話を実現できるでしょう。また、音声会話は、テキスト入力が難しい状況でも利用できるメリットがあります。例えば、自動車を運転しながらChatGPTと会話したり、料理をしながらChatGPTにレシピを教えてもらったりといったことが可能になります。

画像認識機能については、例えば、自転車の写真と問題解決の為にChatGPTへ質問した内容は自転車の型番と形状等から正しい問題解決方法に素早くたどりつけそうというご指摘は、非常に興味深いです。画像認識機能により、ChatGPTはユーザーが提示した画像の情報を理解し、それに関連する情報を提供できるようになります。例えば、自転車の写真から型番を特定し、その型番の取扱説明書や修理方法を検索して提示するといったことが可能です。

今後、ChatGPTがこれらの機能をどのように活用していくのか、楽しみですね。

以下に、画像認識・音声認識・発話機能がChatGPTに追加されることによる、具体的なメリットをいくつか挙げてみました。

  • 音声認識・発話機能により、テキスト入力が難しい状況でもChatGPTを利用できるようになります。
  • 画像認識機能により、ChatGPTはユーザーが提示した画像の情報を理解し、それに関連する情報を提供できるようになります。
  • 音声会話は、より自然で臨場感のあるコミュニケーションを実現できます。

これらのメリットにより、ChatGPTはより便利で使いやすくなり、ユーザーの満足度が向上すると考えられます。

Bingの場合「より創造的に」

Bardと同じ記事の最初の三段落文章をBingの「より創造的に」に入力しました。

Bingの応答を引用
こんにちは、こちらはBingです。ご質問ありがとうございます。😊

「ChatGPT Plus」や「ChatGPT Enterprise」の契約者が画像認識・音声認識・発話機能を利用できるように約二週間で変更されるとの事ですが、私はその詳細についてはお答えできません。私はBingのチャットモードであり、ChatGPTとは異なるサービスです。申し訳ありませんが、ChatGPTに関するお問い合わせは[公式サイト]や[カスタマーサポート]にお願いします。

音声認識と発話機能については、私もスマホのアプリで利用可能ですが、有名声優等による音声データを用いた音声会話は現在提供していません。しかし、将来的にはそのような機能が実現される可能性もあります。面白い音声チャットのコミュニケーションは進化していくと思います。

画像認識については、私も自転車の写真と問題解決の為に質問した内容を理解できます。自転車の型番と形状等から正しい問題解決方法に素早くたどりつけると思います。自転車の型番は確認に時間がかかる事もありますから有為な機能だと思います。

私はBingのチャットモードとして、様々な話題や内容についてお話しできます。もし何かご希望がありましたら、お気軽にお申し付けください。😊

当サイトの関連記事
企業向けの「ChatGPT Enterprise」が一般に提供へ
マイクロソフト社が生成AIの拠点を日本国内に設置で影響は
Bardの英語版に画像認識機能と日本語版を含め読み上げ機能追加