OpenAIのWhisperを利用して音声をテキストへ変換できるiPhoneアプリ「Hello Transcribe」がMacにも対応しています。詳細は以下から。
2022年09月にOpenAIがWeb上から収集した68万時間の音声データを利用し学習させた自動音声認識モデル「Whisper」を公開して以来、このWhisperを利用し人間の音声をテキストへ変換してくれるAikoやWhisper Transcription、Cheetahなどの様々なMacアプリがリリースされていますが、新たに「Hello Transcribe」というWhisperを利用したiPhoneアプリがMacにも対応しています。
Hello Transcribe is a private and secure speech to text transcriber that uses OpenAI Whisper and Whisper.cpp.
Hello Transcribe – Mac App Store
Hello Transcribeは南アフリカ共和国でエンジニアをされているBen Nortierさんが2022年から開発しているWhisper/Whisper.cppを利用した音声書き起こし/文字起こしアプリで、これまでiPhoneとiPadに対応していましたが、Hello Transcribe v2.6アップデートからMacにも対応し、iCloudを利用した文字起こしの同期やProサブスクリプションの共有が可能になっているそうです。
Hello Transcribe for macOS is out 🙌https://t.co/SNpmp9mOY6#OpenAI #AI #Whisper #Whisper.cpp pic.twitter.com/0aaE4DOGxz
— Ben Nortier (@bjnortier) July 28, 2023
Caveat: The CoreML optimisation (+caching) step on macOS 13 takes a VERY long time. On my M1 Max it can take 20 minutes to optimise the “small” model, but on macOS 14 it takes 60 seconds.
Hello Transcribe goes Multiplatform – bjnortier
Hello Transcribeは音声データやマイクからの音声入力はもちろん、v2.7以降ではMP4動画内の音声の書き起こしにも対応しており、Appleの機械学習フレームワークCoreMLも利用できますが、macOS 13 VenturaではCoreMLの最適化に問題があるのか、Apple M1 Maxチップを搭載したMacでもSmallモデルで最適化に20分かかる*場合があるそうです。
Hello Transcribeのシステム要件はiOS/iPadOS 16以降のiPhone/iPad、macOS 13 Ventura以降のMacとなっており、Whisperのtinyモデルを利用した書き起こしや書き起こしたデータの保存、VTT/SRTファイルへの書き出しは無料版でも可能ですが、baseとsmallモデルを利用するには月額300円のProサブスクリプション(14日のトライアル期間付き)の登録か、1,000円の一括購入が必要となっています。
- Hello Transcribe – Mac App Store
- Hello Transcribe goes Multiplatform – bjnortier
コメント