ChatGPT は、特に有料の場合、昨年末の導入以来、大きく変わりました。GPT-4 は強力なアップグレードですGPT-3.5以上、およびプラグインはサードパーティのサービスに接続しますChatGPT をさらに便利にするために。現在、チャットボットは再び変化しており、テキストベースの会話を超えて、ビジュアルコンテンツとオーディオコンテンツの両方をサポートするように拡張されています。
OpenAI は ChatGPT に対するこれらの変更を発表しました月曜日の発表で。 Plus に登録している限り、ChatGPT に直接話すことも、チャット内で画像を共有することもできるため、ボットの有用性が向上する可能性があります。描画ツールを使用して、AI を希望する場所に集中させて、画像の特定の要素について ChatGPT に質問することができます。さらに、ChatGPT はあなたの声を理解するだけでなく、独自の音声を備えているため、実際に会話することができます。
ChatGPTで画像を共有する
同社は紹介ビデオで次の例を披露しました: あなたは自転車のシートを下げる方法を理解するのに苦労しているかもしれません。 ChatGPT アプリを起動し、自転車の写真を撮り、ChatGPT に助けを求めることができます。ソリューションの概要が示されますが、より詳細なコンテキストについては別の図が必要になる場合があります。次に、別の写真 (おそらく座席自体のクローズアップ) を撮り、座席のロックの周りに円を描いて、ChatGPT の注意をそこに集中させることができます。
OpenAI のサンプルビデオによると、ChatGPT は自転車のさまざまな部品を区別できるようになります。特定の部品が自転車のレバーであるかどうかを尋ねると、ChatGPT は実際には六角レンチで緩める必要があるボルトであると応答する可能性があります。しかし、それよりも素晴らしいのは、自転車のマニュアルと工具箱を共有して、仕事に適した工具があるかどうかを尋ねることができることです。 ChatGPT は画像を分析し、確認または拒否します。適切なツールをお持ちの場合は、それがツールボックスのどこにあるかが表示されます。
最後に、サンプルビデオのユーザーはChatGPTの協力に感謝し、AI企業は将来のロボットの支配者に対して私たちが親切にする必要があると考えているのではないかという私の疑念を再び裏付けました。
ここでの可能性は上記の例を超えています。冷蔵庫の中身の写真を撮って ChatGPT に夕食の計画を手伝ってもらうこともできますし、建物の画像を送ってその建設の歴史を尋ねることもできます。この機能は、Plus および Enterprise ユーザー向けのすべての ChatGPT プラットフォームで利用でき、今後 2 週間にわたって展開されます。
ChatGPT で会話する
もちろん、ChatGPT は視覚的な要素だけでなく、聴覚的な要素も使用します。 2 番目のビデオ例では、ユーザーが ChatGPT に「ラリーという名前の超一流のヒマワリハリネズミ」についての話をしてほしいと音声で尋ねています。会社のビデオ紹介するからと 3世界へ。彼らは、ChatGPT がラリーについて少し話すことから始めたいと考えています。もちろん、ChatGPT はラリーのイントロを生成し、その後ユーザーが家がどんな感じだったかを尋ねます。これは、あたかも ChatGPT がその場で即興で演奏する実際のストーリーテラーであるかのように、行ったり来たり続きます。
この機能の優れている点は、テキストベースのチャットと比較して非常に自然であることです。マイク ボタンをタップすると、いつでも ChatGPT を中断できるため、ボットが説明している内容について詳細を尋ねたり、会話を完全にリダイレクトしたりすることができます。音声は ChatGPT アプリでのみ利用可能です。iOSそしてアンドロイド、今後 2 週間にわたって Plus および Enterprise ユーザーにも展開されます。この機能をオプトインするオプションは次のとおりです。設定 > 新機能。次に、右上のヘッドフォン ボタンをタップし、5 つのオプションから好みの音声を選択します。 (OpenAI は実際に声優と協力してこの機能を開発しました。)
このツイートは現在利用できません。読み込み中か削除された可能性があります。
もちろん、他の AI 機能と同様に、これらのオプションも完璧ではなく、同様の影響を受ける可能性があります。幻覚のリスク私たちは過去に見たことがあります。 OpenAI はその事実をよく認識しています。同社は、過激主義や科学的熟練度などの問題に対してレッド チームのメンバーと画像モデルをテストし、視覚障害のある人が携帯電話を使用して「彼らのために」を参照してください。このモデルは、人物に関する結果を返す能力にも限界があります。
簡単に言うと、リスクの高い状況や深刻な状況では、これらの機能に依存しないでください。自転車のシートを調整していますか?もちろん。車のタイヤを交換しますか?ハードパス。