macOS Sierra 10.12.2のプレビューアプリによりScanSnapなどのドキュメントスキャナで処理したOCRレイヤーが破壊される条件と対処法。

スポンサーリンク

 macOS Sierra 10.12.2のプレビューアプリによりScanSnapなどのドキュメントスキャナで処理したOCRレイヤーが破壊される条件と対処法のまとめです。詳細は以下から。


 昨日、TidBitsがmacOS SierraのPDFKitにはmacOS 10.12(.0) ~ 10.12.2までに潜在的な不具合が存在し、macOS 10.12.2ではScanSnapやDoxie QなどのドキュメントスキャナでOCR処理したPDFファイルがmacOSのプレビューアプリにより破壊され、

サードパーティ製PDFビュワーやアプリに影響を及ぼしている状態を紹介していますが、この現象はどの様な状態で発生しどう対処したらよいかをまとめました。

スポンサーリンク

検証

 まず、この不具合が発生する現象ですが、これについてはDocumentSnapの開発者のBrooks Duncanさんの検証をもとにmacOS/OS Xのバージョンを以下のように変更し、OCR化したPDFファイルを各バージョンのプレビューアプリで使用してみました。

  • macOS Sierra 10.12.2
    ▶プレビューアプリでPDFファイルを開くだけ ⭕/PDFファイルを開き操作&保存 ❌
  • macOS Sierra 10.12.2
    ▶Adobe AcrobatでPDFファイルを開くだけ ⭕/PDFファイルを開き操作&保存 ⭕
    ▶macOS 10.12.2のプレビューアプリで保存したファイル ❌
  • macOS Sierra 10.12.1
    ▶プレビューアプリでPDFファイルを開くだけ ⭕/PDFファイルを開き操作&保存 ⭕
    ▶macOS 10.12.2のプレビューアプリで保存したファイル ❌
  • macOS Sierra 10.12
    ▶プレビューアプリでPDFファイルを開くだけ ⭕/PDFファイルを開き操作&保存 ⭕
    ▶macOS 10.12.2のプレビューアプリで保存したファイル ❌
  • OS X El Capitan 10.11.6
    ▶プレビューアプリでPDFファイルを開くだけ ⭕/PDFファイルを開き操作&保存 ⭕
    ▶macOS 10.12.2のプレビューアプリで保存したファイル ❌
  • OS X Yosemite 10.10.5
    ▶プレビューアプリでPDFファイルを開くだけ ⭕/PDFファイルを開き操作&保存 ⭕
    ▶macOS 10.12.2のプレビューアプリで保存したファイル ❌
使用したOCR済のPDFファイルはPFUが提供しているサンプルファイル“sv600_c_sf_book.pdf”です。

 結果は以下の通り、macOS Sierra 10.12.2のプレブーアプリでPDFファイルを開き「保存」した時点でOCRレイヤーが破壊され、その後は検索(Spotlight含む)やテキスト選択をする事が不可能になります。(動画は10.12.2~10.11.6の検証以外は省略しています)

*macOS Sierra 10.12.2のプレビューアプリで編集されたかどうかは、プレビューアプリのインスペクタから確認可能で、この項目に「PDFの生成 : Mac OS X 10.12.2 Quartz PDFContext」という記載があればmacOS 10.12.2で何らかの操作が加えられ保存されているはずです。

対処法

 対処法としては、まずOCRレイヤーが破壊されたPDFファイルをmacOSのバージョン管理機能”Time Machine”か、[ファイル] → [バージョンを戻す]を利用して復元します。

今回の不具合はプレビューアプリを介することで発生するため、デフォルトのPDFビュワーアプリをAdobe Acrobat DCなどサードパーティ製アプリに変更し、プレビューアプリを利用しないようにします。

Adobe Acrobat DCが使いづらいという方はSmailのPDFpenやReaddleのPDF ExpertなどのOCRレイヤーの破壊が確認されていないアプリを利用してみてください。

bugs in Preview impact PDFpen customers whose document recipients use Preview rather than PDFpen to view or edit them. We have not had reports of PDFpen causing data loss of documents’ OCR layers.

Sierra PDF Problems Get Worse in 10.12.2

 今回の不具合は、AppleがmacOSとiOSのPDFフレームワークを統合中のため発生してたようですが、Appleはこの事をWWDC 2016でアナウンスしていないため、複数の開発者はAppleは今後PDFフレームワーク(PDFKit)の方向性を明確にすべきだというコメントをしており、頂いたコメントによるとmacOS 10.12.2へアップデートしたユーザーに送った書類が編集され、OCRが利用できなくなったという被害も出ているようなので、macOS 10.12.2&プレビューユーザーの方は注意してください。