OpenAIのText to Speech APIを利用し、テキストの読み上げ/音声ファイルを作成できるMacアプリ「Voices」がリリースされています。詳細は以下から。
OpenAIは現地時間2023年11月06日、OpenAI Dev Dayを開催し、その中でGPT-4 Turboなどと共にテキストを人間が発音するように読み上げてくれるText to Speech(TTS) API「TTS-1」と「TTS-1-HD」を発表しましたが、
このTTS APIを利用し、入力したテキストを読み上げ、音声ファイルに保存できるMacアプリ「Voices」が新たにリリースされています。
Voicesを開発&公開したのはiPhoneアプリ「Navi」でApple Design Awards 2022を受賞し、現在はOpenAIの音声認識モデルWhisperを利用し音声からテキストを書き起こしてくれるMacアプリ「MacWhisper (Whisper Transcription)」などを開発しているJordi Bruinさんで、
Voices is available now! Easily use the new Text-To-Speech APIs from OpenAI with your own API key. Very early but already very useful.
– History
– View costs before generating audio file
– Adjust voice, quality and output formatGet it for free: https://t.co/V5t7RhSfg8
— Jordi Bruin (@jordibruin) November 8, 2023
利用するにはユーザーのTTS APIキーが必要で価格はtts-1は0.015ドル/1K characters、tts-1-hdは0.030ドル/1K charactersとなっていますが、VoicesはGumroadから無料でダウンロード可能で、AlloyやEcho、Fableなど6つの異なる音声とMP3やFLAC、OPUS、AACフォーマットでの音声ファイルの保存に対応しているので、興味のある方は試してみてください。
- Text to speech – OpenAI API
- Voices – High Quality Text to Speech with OpenAI – Gumroad
コメント