OpenAIの音声認識モデルWhisperを利用し音声からテキストを書き起こしてくれるMacアプリ「MacWhisper (Whisper Transcription)」がリリース。

MacWhisper (Whisper Transcription)で書き起こししたNHKニュース 仕事効率化
記事内に広告が含まれています。
スポンサーリンク

 OpenAIの音声認識モデルWhisperを利用し音声をテキストへ書き起こしてくれるMacアプリ「MacWhisper (Whisper Transcription)」がリリースされています。詳細は以下から。

MacWhisper (Whisper Transcription)

 ChatGPTやGPT-3などを開発しているOpenAIは2022年09月、Web上から収集した68万時間にも及ぶ音声データを利用し学習させた自動音声認識(ASR: Automated speech recognition)システムWhisperを公開しましたが、その音声認識モデルを利用して音声ファイルをテキストへ変換(書き起こし)してくれるMacアプリ「MacWhisper (Whisper Transcription)」が新たにリリースされています。

MacWhisper (Whisper Transcription)で書き起こししたNHKニュース

Quickly and easily transcribe audio files into text with OpenAI’s state-of-the-art transcription technology Whisper. Whether you’re recording a meeting, lecture, or other important audio, Whisper for Mac quickly and accurately transcribes your audio files into text.

Whisper Transcription – Mac App Store

 Whisper Transcriptionを公開したのはVividForeheadなどのMac用ユーティリティを開発しているオランダのJordi Bruinさんで、今年01月にGumroadで販売を開始したMacWhisperをMac App Storeで公開できるよう調整したそうですが、機能的にはほぼ同じで音声ファイルをウィンドウにドラッグ&ドロップするだけで、オンデバイスで音声をテキストへ変換してくれます。

 変換したテキストは間違った箇所を修正し、プレーンテキストやCSV、字幕(.str, .vtt)形式に書き出すことが可能で、日本語を含めた100以上の音声の書き出しに対応しており、システム要件はmacOS 12.4 Monterey以降のMac(Apple Silicon Macを推奨)となっています。

 アプリはMac App Storeで無料公開されていますが、今後はLarge/独自の学習モデルを追加できる機能などをWhisper Transcription Proとしてアプリ内課金で提供していくそうです。

コメント

タイトルとURLをコピーしました