Adobe Acrobat 文字認識OCR機能
管理者用Adobe Acrobat は、だいぶ進化しているようです。
PDFファイルのまま、ちょっとした修正なんて出来るのです。
先日、画像ファイルが180度さかさまになっているのを見つけ、PDFファイルのまま簡単に修正出来たのです。
この仕事、画像を600枚ほどスキャニングしたものです。
そして、インデザインの結合機能をつかって貼り付けました。
中の1枚ぐらいは、逆さの画像もあるかもしれません。(あってはいけません)
インデザインファイルからPDFにしたあと、最終段階に入って、見つかった不具合です。
必要に迫られないと調べないのは私だけでは無いと思います。
しかし、そのような機能が有る事も知らなければ、そのままです。
このへんのところは難しい問題ですね_!
まだまだ、知らない機能があるようです。
前置きが長くなってしまったのですが、ここからが、今日の本題です。
Acrobatに、文字認識機能が有るんです。
操作の中で、偶然知った機能でした。
FAXの複合機で、ある書類をスキャニングしました。
形式は、PDFファイルです。
そのファイルを、たまたま Acrobatの 修正 操作を行ったのです。
例題を使って説明します
複合機でスキャニングしたPDFファイル
ファイルを開き ⇒[ツール]⇒[PDFを編集]
なにやら、動き出しました・・・・・・・・・・・・
斜めになっている画像を水平に修正してから、PDF画像から文字をキャラクター化して行くのです。
・・・・・・・・・・・・・・
そしてストップ。
結果、画像やテキストが細かくブロックされて配置されました。
実際に各ブロックを移動してみました。
削除して見ました。
元のPDFファイルに近いフォント、レイアウトです。
認識精度を評価する必要はあるようですが、どうですか、この機能、使えませんかねー!