数式のスクリーンショットや写真をLaTeX形式に変換してくれるアプリ「Mathpix Snip」が日本語や中国、韓国、ロシア、ヒンディー語などのOCRに対応したそうです。詳細は以下から。
スクリーンショットや写真から数式をLaTeX形式へ変換してくれるツール「Mathpix Snip」シリーズを開発&公開している米Mathpix Inc.は現地時間2020年06月02日、同社がMathpix Snipシリーズに利用しているOCRエンジン「Mathpix OCR」をアップデートし、英語以外のテキストのOCRに対応したと発表しています。
Mathpxi OCRサポート言語
- Hindi (Devanagiri)
- Korean (Hangeul)
- Mandarin (simplified + traditional)
- Vietnamese (Latin alphabet + accents)
- Japanese (Kanji + Hiragana + Katakana)
- Russian (Cyrillic)
- Thai (Thai script)
新たにテキストの読み取りをサポートした言語は日本語に加えて、ヒンディー語、韓国語、中国語(簡体字+繁体字)、ベトナム語、ロシア語、タイ語で、日本語は漢字+ひらがな+カタカナのOCRをサポートしており、
昨年末に提供が始まった、パラグラフとパラグラフ内の数式を識別してLaTeX化してくれる「Mathpix OCR 2.0」ベースで利用できるため、論文などのFull Page Scanにも利用できそうですが、Full Page Scanを利用すると当然精度が下がので書き起こしなどに利用する場合は注意して下さい。
- Mathpix Snip – Mathpix
- MathpixのApp – App Store
コメント