OpenAIだけでなく、ElevenLabsやPlayAI、Kokoroによるテキストの読み上げ/音声ファイル作成が可能になったMac用TTSアプリ「Voices 2.0」がリリースされています。詳細は以下から。
VoicesはOpenAIの音声認識モデルWhisperを利用し、音声からテキストを書き起こし(Speech to Text)てくれるMacアプリ「MacWhisper (Whisper Transcription)」などを開発しているJordi Bruinさんが2023年に公開した、入力したテキストを読み上げてくれるMac用のTTS (Text to Speech)アプリですが、このVoices初のメジャーアップデートとなる「Voices v2.0」がリリースされています。
More providers
Voices now supports generating speech with OpenAI, ElevenLabs, PlayAI and Kokoro (through Replicate). Just bring your own API key and get generating.リリースノートより抜粋
Voices v2.0ではOpenAIに加え、米ElevenLabsやPlayAI、Kokoroの3社がTTSプロバイダーに追加され、各プロバイダーのAPIを入力し、Macでテキスト読み上げ/音声ファイルの作成が可能になっています。
また、Voices v2.0では複数のTTSプロバイダーに対応したことで、各プロバイダーの音声を同時に利用したテキストの読み上げと音声ファイルの作成が可能になり、生成した音声はドラッグ&ドロップで他のアプリにインポートできるようになりました。
Voices v2.0では、この他、とUIの刷新やアイコンの変更が行われ、システム要件はmacOS 14.5 Sonoma以上のIntel/Apple Silicon Macとなっていますが、アプリは引き続き無料(Gumroadで0€)で公開されているので、気になる方は試してみてください。
- 🗣️ Voices – Text to Speech – Gumroad
コメント