Google Gemini APIを利用し、手書きの数式をLaTeX形式に変換してくれるmacOS用OCRアプリ「LaTeX-OCR」がリリースされています。詳細は以下から。
LaTeX-OCRはカナダのウォータールー大学で数学を専攻するSamuel Zhangさんが公開したオープンソースの数式OCRアプリで、手書きの数式などをキャプチャ&GoogleのGemini APIを利用しLaTeX形式に変換してくれる機能があります。
A simple macOS menu bar application to perform OCR on screen captures, with a special focus on extracting mathematical equations into LaTeX format using the Google Gemini API.
SamuelZ12/LaTeX-OCR – GitHub
LaTeX-OCRはオープンソースで公開されていますが、AppleのDeveloper Programには加入していないため、初回起動時アプリはGatekeeperにブロックされるため、一旦[完了]をクリックしてシステム設定アプリの[プライバシーとセキュリティ] → [セキュリティ]でアプリの起動を許可し、
起動後にメニューバーに表示されるLaTeX-OCRアイコンから[Settings]を選択、Google AI Studioで取得したGemini API Keyを入力することで[Extract LaTeX]メニューから数式をキャプチャ&LaTeX形式に変換することが出るようになります。
LaTeX-OCRはAIを利用した既存のWebコンバーターのステップを短縮するために作成したそうで、キャプチャしたLaTeXコードは自動的にクリップボードに保存され、グローバルショートカットキーやLaTeXフォーマットの設定、過去に変換したLaTeXコードの保存機能、Geminiモデルの選択に加え、
AppleのVision APIを利用したテキストORCにも対応しており、システム要件はmacOS 14 Sonoma以降のIntel/Apple Silicon Macで、アプリはMITライセンスでGitHubリポジトリに公開されているので、気になる方は試してみてください。
- SamuelZ12/LaTeX-OCR – GitHub
コメント