OpenAIの音声認識モデルWhisperを利用し音声をテキストへ変換してくれるMacアプリ「AI Transcription」がリリースされています。詳細は以下から。
ChatGPTなどを開発するOpenAIは2022年09月、Web上から収集した68万時間にも及ぶ音声データを利用し学習させた自動音声認識(ASR: Automated speech recognition)システム「Whisper」を公開しましたが、このWisperを利用し、音声をテキストへ変換してくっるMacアプリ「AI Transcription」が新たにリリースされています。
Turn audio into text! AI Transcription uses advanced Speech Recognition to transcribe your audio and video files in a blink, fully automatically, all offline, and with highly accurate results.
AI Transcription – Mac App Store
AI Transcription
AI Transcriptionを開発&公開したのは、Stable Diffusionを利用しテキストから画像を生成できるMac/iPhone, iPadアプリ「AI Photo」を開発しているドイツのMartin Lexowさんで、AI Transcriptionを利用するには、まずmacOSのシステム設定アプリから[キーボード] → [音声入力]で音声をテキストへ変換したい言語を追加*し、AI Transcriptionの設定 → [言語]設定で言語を選択。
後は、オーディオやビデオファイルをウィンドウにドラッグ&ドロップするだけで、ファイル内の音声がオンデバイスでテキスト化され、.txtや.csv, .srt, .vttファイルで書き出すことができます。
The only #AI Transcription app you’ll ever need 🎙️ pic.twitter.com/Yq314SOd4l
— Martin Lexow (@martinlexow) February 4, 2023
AI Transcriptionのシステム要件はApple Silicon(推奨)を搭載したmacOS 13.1 Ventura以降のMacでアプリは無料で公開されていますが、初期リリースでは英語やドイツ語、イタリア語、スペイン語、ポルトガル語、ロシア語、トルコ語、簡体字中国語のみのサポートで、
MacWhisperの様に音声認識モデルの選択には対応していないので、より精度の高い書き起こしを行いたい方は「MacWhisper (Whisper Transcription)」を試してみてください。
- AI Transcription – Mac App Store
コメント