Metalフレームワークサポートし、Apple Silicon Macで音声をテキストへ変換する速度が2~3倍に高速化された「Whisper Transcription v6.0」がリリースされています。詳細は以下から。
Whisper Transcription(Gumroad版はMacWhisper)は、Good SnoozeのJordi Bruinさんが開発しているOpenAIの音声認識モデルWhisperを利用し、音声や動画ファイルをドラッグ&ドロップするだけで、ファイル内の音声をテキストに変換してくれる機能がありますが、このアプリの最新バージョンとなる「Whisper Transcription v6.0」がリリースされています。
Metal support! The transcription process now runs using your GPU with the Metal framework. Especially on Apple Silicon Macs this leads to 2 to 3x speed improvements! Let us know if you run into anything related to this.
Whisper Transcription – Mac App Store
Whisper Transcription v6.0では、ベースとなっているwhisper.cppがAppleのMetalフレムワークをサポートしたことで、これまでCPUで行われていた変換処理が、より高速なGPUで行えるようになったため、Apple Silicon Macでは2~3倍高速な変換が見込まれるそうで、
実際に10コアCPUと16コアGPUを搭載したM1 Pro搭載のMacBook Pro (14インチ, 2021)でWhisper Transcription v5.7とv6.0の処理を比較したところ、Siriがする約2分程の昔話「まゆのロケット」はv5.7では書き起こしに10秒かかったのに対し、v6.0では5秒ほどで処理出来たので、興味のある方は試してみてください。
おまけ
Whisper Transcription (MacWhisper)は全ての機能を利用するには年間2,000円、または3,500円のLifetimeライセンスが必要ですが、OpenAIのSmallモデルまでは無料で利用できます。
- 🎙️ MacWhisper – Gumroad
- Whisper Transcription – Mac App Store
コメント