OpenAIのText to Speech APIを利用し、テキストの読み上げ/音声ファイルを作成できるMacアプリ「Voices」がリリース。

仕事効率化

2023.11.12

記事内に広告が含まれています。This article contains advertisements.

　OpenAIのText to Speech APIを利用し、テキストの読み上げ/音声ファイルを作成できるMacアプリ「Voices」がリリースされています。詳細は以下から。

　OpenAIは現地時間2023年11月06日、OpenAI Dev Dayを開催し、その中でGPT-4 Turboなどと共にテキストを人間が発音するように読み上げてくれるText to Speech(TTS) API「TTS-1」と「TTS-1-HD」を発表しましたが、

このTTS APIを利用し、入力したテキストを読み上げ、音声ファイルに保存できるMacアプリ「Voices」が新たにリリースされています。

　Voicesを開発＆公開したのはiPhoneアプリ「Navi」でApple Design Awards 2022を受賞し、現在はOpenAIの音声認識モデルWhisperを利用し音声からテキストを書き起こしてくれるMacアプリ「MacWhisper (Whisper Transcription)」などを開発しているJordi Bruinさんで、

Voices is available now! Easily use the new Text-To-Speech APIs from OpenAI with your own API key. Very early but already very useful.

– History
– View costs before generating audio file
– Adjust voice, quality and output format

Get it for free: https://t.co/V5t7RhSfg8

— Jordi Bruin (@jordibruin) November 8, 2023

利用するにはユーザーのTTS APIキーが必要で価格はtts-1は0.015ドル/1K characters、tts-1-hdは0.030ドル/1K charactersとなっていますが、VoicesはGumroadから無料でダウンロード可能で、AlloyやEcho、Fableなど6つの異なる音声とMP3やFLAC、OPUS、AACフォーマットでの音声ファイルの保存に対応しているので、興味のある方は試してみてください。