Metalフレームワークサポートし、GPUを利用することでApple Silicon Macで音声をテキストへ変換する処理が2~3倍に高速化された「Whisper Transcription v6.0」がリリース。

Whisper Transcription v6 仕事効率化
記事内に広告が含まれています。
スポンサーリンク
スポンサーリンク
スポンサーリンク

 Metalフレームワークサポートし、Apple Silicon Macで音声をテキストへ変換する速度が2~3倍に高速化された「Whisper Transcription v6.0」がリリースされています。詳細は以下から。

Whisper Transcription

 Whisper Transcription(Gumroad版はMacWhisper)は、Good SnoozeのJordi Bruinさんが開発しているOpenAIの音声認識モデルWhisperを利用し、音声や動画ファイルをドラッグ&ドロップするだけで、ファイル内の音声をテキストに変換してくれる機能がありますが、このアプリの最新バージョンとなる「Whisper Transcription v6.0」がリリースされています。

Whisper Transcription v6

Metal support! The transcription process now runs using your GPU with the Metal framework. Especially on Apple Silicon Macs this leads to 2 to 3x speed improvements! Let us know if you run into anything related to this.

Whisper Transcription – Mac App Store

 Whisper Transcription v6.0では、ベースとなっているwhisper.cppがAppleのMetalフレムワークをサポートしたことで、これまでCPUで行われていた変換処理が、より高速なGPUで行えるようになったため、Apple Silicon Macでは2~3倍高速な変換が見込まれるそうで、

Encoder performance on Apple M1 Max - before and after

Encoder performance on Apple M1 Max – before and after

実際に10コアCPUと16コアGPUを搭載したM1 Pro搭載のMacBook Pro (14インチ, 2021)でWhisper Transcription v5.7とv6.0の処理を比較したところ、Siriがする約2分程の昔話「まゆのロケット」はv5.7では書き起こしに10秒かかったのに対し、v6.0では5秒ほどで処理出来たので、興味のある方は試してみてください。

Whisper Transcription v5.7とv6.0の比較

クリックで拡大

おまけ

 Whisper Transcription (MacWhisper)は全ての機能を利用するには年間2,000円、または3,500円のLifetimeライセンスが必要ですが、OpenAIのSmallモデルまでは無料で利用できます。

Whisper Transcription v6.0

コメント

タイトルとURLをコピーしました