macOS 26 TahoeやiOS 26では、新しいSpeechAnalyzer APIにより電話やメモなどにも実装されている音声文字起こし機能がサードパーティアプリでも利用可能に。

SpeechAnalyzer API speech-to-text to your app macOS 26 Tahoe
記事内に広告が含まれています。This article contains advertisements.
スポンサーリンク

 macOS 26 TahoeやiOS 26では、新しいSpeechAnalyzer APIにより電話やメモなどにも実装されている音声文字起こし機能がサードパーティアプリでも利用可能なるそうです。詳細は以下から。

SpeechAnalyzer API

 AppleはmacOS 15 SequoiaやiOS 18、iPadOS 18でメモやボイスメモ、電話、ジャーナル、FaceTimeアプリなどに音声や通話録音の文字起こし機能を実装し、ユーザーはオンデバイス処理で音声文字起こし(Speech to Text)を行えるようになっていますが、

iOS 18のボイスメモ音声文字起こし

iOS 18のボイスメモ音声文字起こし

WWDC25のセッション227「Bring advanced speech-to-text to your app with SpeechAnalyzer」によると、AppleはmacOS 26 TahoeやiOS/iPadOS 26、tvOS 26、visionOS 26などに新しいSpeechAnalyzer APIとTranscriberモデルを導入し、Apple製アプリと同じ音声書き起こし機能をサードパーティアプリに実装できるようにするそうです。

SpeechAnalyzer API

WWDC25:Bring advanced speech-to-text to your app with SpeechAnalyzer

新しいSpeechAnalyzer API

 AppleでSpeech Frameworkエンジニアと務めるDonovan VossさんにとNotesエンジニアを務めるShantini Vyasさんによると、SpeechAnalyzer APIは約10年前の2016年09月にリリースされたiOS 10や、2019年リリースのmacOS 10.15 Catalinaで導入したSFSpeechRecognizer APIに代わる全く新しい音声文字起こしモデルで、旧SFSpeechRecognizer APIはSiri用音声モデルで処理はサーバーベースで、1分程度の短い音声での使用が推奨されていましたが、

SFSpeechRecognizerとSpeechAnalyzer

SFSpeechRecognizerとSpeechAnalyzer

SpeechAnalyzer APIとSpeechTranscriberモデルは旧APIと比較してオンデバイス処理で音声からの文字起こし処理が速く、長時間の音声録音と、遠くの音声認識、複数人による音声認識に対応し、音声認識モデルアセットの管理やSwiftフレンドリーとなっているのが特徴となっているそうです。

SpeechTranscriber APIとSpeechTranscriber Model

SpeechTranscriber APIとSpeechTranscriber Model

 Appleの新しい音声文字起こし機能はiOS 18.4で日本語にも対応しているため、SpeechTranscriberモデルも日本語のほか、広東語と中国語、英語、フランス語、ドイツ語、イタリア語、韓国語、ポルトガル語、スペイン語に対応し、MacやiPhone/iPad、Apple TV、Vision Pro (Apple Watch以外)のAppleデバイスで利用でき、

新しいSpeechAnalyzer API

もちろん、SpeechTranscriberモデルはAppleのパーソナルインテリジェンスシステム「Apple Intelligence」との連係も可能なため、Apple Intelligenceの作文ツールを利用し、文字起こしの要約や校正などもできるそうなので、開発者の方はチェックしてみてください。

Apple Intelligence

Bring advanced speech-to-text to your app with SpeechAnalyzer

コメント

タイトルとURLをコピーしました