OpenAIが全有料プランユーザー向けに提供している「高度な音声モード」を大幅にアップデートしています。詳細は以下から。
米OpenAIは現地時間2025年06月07日、同社のAIチャットボットChatGPTの機能の一部として提供している「高度な音声モード (Advanced Voice Mode)」機能を大幅に強化/アップデートし、イントネーションと自然な会話により、より人間らしい会話が可能になったと発表しています。
We’re upgrading Advanced Voice in ChatGPT for paid users with significant enhancements in intonation and naturalness, making interactions feel more fluid and human-like.
リリースノートより抜粋
OpenAIは、昨年07月にChatGPTアプリ内で高度な音声モードの提供を開始しましたが、今回のアップデートでは人間が話す会話内での微妙なイントネーションや会話中の”間”、強調、そして共感や皮肉などの感情表現が再現できるようになっており、
加えて、音声モードでユーザーが「今から話す日本語を英語に翻訳して」などというように指示した際に行われる翻訳機能もアップデートされ、翻訳し欲しい文章を含む会話全体を通して会話機能が継続され、翻訳の停止を指示するまで翻訳が継続するため、より会話中の翻訳がよりスムーズになっています。
高度な音声モードのアップデートは全ての有料プランユーザーに提供され、MacやiPhone、Android、Web版など全てのプラットフォームと全ての地域で提供されるそうなので、ChatGPTユーザーの方はプロンプト右側の「音声アイコン (Voice icon)」をクリックして試してみてください。
おまけ
なお、高度な音声モードのテスト段階では、予期しないトーンの変化や、急に会話のピッチが速くなる問題が一部の音声オプションで確認されており、この問題は今後改善される予定とのことですが、それ以外にも、今回のアップデートでは高度な音声モードでは稀に意図しない音声広告や意味不明な言葉、バックグラウンドミュージックなどの「ハルシネーション/幻聴」が聞こえる問題が確認されており、OpenAIは現在この問題を調査し改善する方向で動いているそうです。
Additionally, rare hallucinations in Voice Mode persist with this update, resulting in unintended sounds resembling ads, gibberish, or background music. We are actively investigating these issues and working toward a solution.
Release Notes – ChatGPT
- Release Notes – ChatGPT
コメント