ヘルプ: OCR (光学文字認識)
OCR(光学文字認識)はテキストのビットマップ画像(スキャン文書など)をPDFpenや他のテキストエディタにより選択、コピーおよび検索可能なテキストに変換するプロセスです。
一度テキストがOCRにより認識されれば、目視できるテキスト画像の上に見えないレイヤーが配置されます。テキストをコピーした場合、テキストはこの見えないOCRレイヤーからコピーされます。
OCR技術はビットマップテキストからの完全なレンダリングを生成する物ではありません。OCR結果は校正と編集が必要です。
PRODUCTNAMEでOCRを実行
- PRODUCTNAMEを使って、スキャンされたPDFを開いてください。
- 警告ボックスが表示され、
;
「このドキュメントはスキャンされたいるようです。文字認識オプション(OCR)を実行しますか。OCRでテキストを選択できます」
というメッセージが現れます。
3つの選択肢があります。
- キャンセル:
OCRを実行しません。
- OCRページ:
OCRを現在開かれているページで実行します。
- OCRドキュメント:
ドキュメントが複数ページあるときは、OCRは全てのページで実行されます。
OCRでどの言語を認識するか選択できます。詳細は環境設定>OCRを参照。
PRODUCTNAMEでOCRを実行しているときには、プログレスバーが表示されます。この操作はスキャンされたドキュメントの内容量によりますが、2、3分以上かかります。
マニュアル操作でOCRを実行するときは、「編集>ページOCR」を選んでください。PRODUCTNAMEがOCR操作を開始し、プログレスバーが表示されます。
OCRを強制
PDFpen
はドキュメントをドキュメント読み込み、1ページ分の大きさのイメージを認識したときに、スキャンされたドキュメントであると想定し、自動的にOCR操作
を提案します。場合によっては、PRODUCTNAMEがスキャンされたドキュメントを認識できないときもあります。「編集」メニューの「OCR」は灰色に
なっており、選択することができません。
- CommandキーとOptionキーを一緒に押してください。
- メニューから「編集>OCR」を選んでください。
テキストの選択、コピーと訂正
度OCRが完了したら、ドキュメントのテキストは他のテキストと同様に編集できます。表示テキストの変更を行うにはテキスト訂正 を使用します。「テキストの操作」を参照
OCRテキストの検索
OCR操作で作成されたテキストは、普通のテキストのように編集することができます。詳細はPDF内での検索を参照。
OCR操作結果の改善のためのヒント
- OCR操作の質は、オリジナルドキュメントの質の左右されます。 くしゃくしゃに皺のいったコピーをさけ、はっきりとしたテキストの読める皺のないものを選んでください。
- オリジナルドキュメントをスキャナー上にまっすぐにおいてください。まっすぐにスキャンされていないときには、編集> Dイメージのアンスキュー&調整を開いて、PRODUCTNAME上のイメージをアンスキューするかまっすぐにすることができます。
- スキャンされたドキュメントのコントラストを高めることによって、背景がより白くなります。編集> イメージのアンスキュー&調整を開いて、コントラストを調整してください。
OCRテキストレイヤーを見る
一度OCRプロセスによりテキストが認識されたら、目に見えるテキストの上に見えないレイヤーが配置されます。テキストをコピーした場合、テキストはこの見えないOCRテキストレイヤーからコピーされます。
OCRテキストレイヤーのテキストはビットマップテキストのレンダリングに近いですが完全ではありません。OCR結果は校正と編集が必要です。OCRテキストをコピー&ペーストするといくつかの誤りが確認できますが、これはその時点で訂正が可能です。
OCRテキストレイヤーを見る:
- 表示メニューからOCRレイヤーを選択します。テキストのレイヤーがドキュメントの上に表示され、通常では見えないOCRテキストを見ることが出来ます。
編集ツールの何れかに切り替えるとOCR表示モードは終了します。
OCRテキストレイヤーの編集
(PRONAMEのみ)
OCRテキストレイヤーに修正を加える。
- 表示メニューからOCR情報の表示を選択します。テキストのレイヤーがドキュメントの上に表示され、通常では見えないOCRテキストを見ることが出来ます。
- テキストをいくつか選択すると、テキストを同時に一単語または一行編集できるオプションウィンドウが表示されます。
OCRテキストレイヤーへの変更はドキュメントの目視できるテキストに対して行われる物ではない為、テキスト訂正ツールによる変更とは異なります。
また、テキスト訂正ツールの使用と同じく、これはドキュメント全体の再編成ではなく誤字脱字の修正を支援します。レイアウト変更や大きな編集にはWord形式へドキュメントをエクスポートし、Wordプロセッサで変更を行います。
|