Google Speechを利用した音声書き起こしサービス&Mac用アプリ「Descript」がリリースされています。詳細は以下から。
海外のPodcast番組で毎回書き起こし(Transcript)を提供しているところがあり知りましたが、元GrouponのCEO Andrew Masonさんが新たに「Descript」という”Google Cloud Speech API(以下、Google Speech)“を利用した文字起こしサービスおよびMacアプリを2017年12月公開しており、このサービスがかなりの精度で自動で文字起こしをしてくれるそうです。
Descript is powered by Google Speech — the most advanced transcription technology, ever. Transcribe your recording in less time than it takes to read this webpage. Subscribers pay just 7¢ a minute.
Transcription and Audio Editing – Descript
精度
Podcastやボイスメモなど様々な音声ファイルをアプリにドラッグ&ドロップ/Webにアップロードするだけで書き起こしを行ってくれるサービスはDescript以外にもHappyscribeやTemi, Trintなど複数ありますが、Descriptが利用しているGoogle Speechは近年、機械学習により人間の書き起こし精度と同程度になっており、
10個のサンプルを利用した”Word Error Rate“ベースでの書き起こし精度比較でも、Descriptの精度が平均95%と最も高かったそうです。
Descriptアプリ
また、Descriptが提供しているMac用アプリもアップデートが続けられており、音声ファイルも.mp3や.m4a, .wav, .aaf等に対応し、先月公開されたv1.2アップデートでは再生速度の調整やエラー箇所の修正中は再生速度を遅くする”Patient Playback”機能、再生位置へカーソルを自動的に移動する”Attach Cursor to Playhead”など様々な新機能が採用されており、
Descriptは現在のところ英語の書き起こししかサポートしておらず、価格も1分7セントと有料ですが、アカウントを作成するだけで合計30分のお試し書き起こし期間が提供されるので、興味のある方は試してみて下さい。
コメント