Aiuto: OCR (= ROC - Riconoscimento ottico dei caratteri)
OCR (Riconoscimento Ottico dei Caratteri) è il processo di conversione da un'immagine bitmap contenente testo (come la fotocopia di un vecchio libro) ad un testo che può essere selezionato, copiato e ricercato da PDFpen o da altri editor di testo.
Una volta che il testo viene riconosciuto dall'OCR, viene messo su un livello invisibile sopra l'immagine analizzata. Quando viene copiato del testo, la sorgente è sempre questo livello OCR invisibile. La Tecnologia OCR non produce un rendering perfetto del testo dall'immagine. Sarà necessario controllare e correggere il testo analizzato dall'OCR.
Usare l'OCR in PDFpen
- Apri un file scannerizzato in PDFpen.
- Apparirà un messaggio di avvertimento
"Questo documento sembra essere scannerizzato. Vuoi eseguire
l'operazione di OCR (optical character recognition)? L'OCR ti
permetterà di selezionare il testo."
Ci sono tre opzioni:
- Annulla:
Non verrà eseguito l'OCR
- Pagina OCR:
Verrà eseguito l'OCR sulla pagina corrente.
- Documento OCR:
Se il tuo documento è composto da più pagine, verrà eseguito l'OCR su tutte le pagine.
Scegli le lingue che dovranno essere riconosciute dall'OCR in Preferenze > OCR.
Durante il processo di OCR apparirà una barra di progressione.
L'operazione potrebbe richiedere alcuni secondi o più tempo, dipende
dalla dimensione e dal contenuto del documento scannerizzato.
Per eseguire l'OCR manualmente, seleziona Composizione > OCR Pagina.
PDFpen inizierà il processo di OCR ed apparirà la barra di
progressione.
Forzare OCR
PDFpen controlla il documento e se trova un'immagine che ha le dimensioni di una pagina assume che il documento è una scansione si offre automaticamente di eseguire l'OCR. In alcuni casi è possibile che PDFpen
non riconosca un documento scannerizzato. Il comando OCR… all'interno
del menu Composizione può risultare grigio e impossibile di selezionare.
- Tieni premuto i tasti Comando ed Opzione simultaneamente.
- Scegli Composizione > OCR... dal menu.
Selezionare, Copiare e Correggere Testo
Una volta che il processo di Riconoscimento Ottico dei Caratteri è finito, il testo del documento può essere modificato come ogni altro testo. Per rendere visibili le correzioni al testo, utilizzare Correggi Testo. Maggiori dettagli in Lavorare con il Testo..
Cercare il testo OCR
Il testo generato dall'operazione di OCR può essere cercato come un testo normale. Vedi Cercare dentro un PDF.
Consigli per migliorare i risultati dell'OCR nei tuoi documenti:
- La qualità del tuo documento originale influenzerà la
qualità delle performance dell'OCR. Testo pulito e nitido produrrà
risultati migliori piuttosto che fotocopie stropicciate e sbiadite.
- Inserisci il tuo documento nello scanner il più dritto possibile.
Se hai un documento già scannerizzato ruotato, puoi "equalizzare",
ossia raddrizzare, l'immagine in PDFpen mediante il comando del
menu Composizione > Equalizza ed Imposta Immagine…
- Aumenta il contrasto del tuo documento scannerizzato in modo da
rendere lo sfondo il più bianco possibile. Puoi impostare il contrasto
dell'immagine mediante il comando del menu Composizione > Equalizza
ed Imposta Immagine…
Visualizzare il Livello di Testo OCR
Una volta che il testo è stato riconosciuto dall'OCR, viene messo su un livello invisibile posto sopra l'immagine analizzata. Quando viene copiato del testo, la sorgente è sempre questo livello OCR invisibile.
Il testo risultante dal processo di OCR risulta da un rendering molto preciso, ma non perfetto, del testo presente nell'immagine. Potrebbe essere necessario ricontrollare e correggere il testo dopo l'analisi OCR. Copiando ed incollando il testo OCR, si potrebbero notare delle imprecisioni opportunamente correggibili.
Mostra il livello di testo OCR:
- Dal menu Visualizza, scegliere Livello OCR. Un livello di testo apparirà sul documento mostrando il testo OCR normalmente nascosto.
Passando ad uno degli altri strumenti si uscirà dalla vista OCR.
Modificare il Livello di Testo OCR
(PDFpenPro Only)
Effettuare correzioni al Livello di Testo OCR.
- Dal menu Visualizza, "scegliere visualizza informazioni OCR". Un livello di testo apparirà sul documento, mostrando il testo OCR normalmente nascosto.
- Selezionando una porzione di testo apparirà una finestra di popup con opzioni per modificare il testo una parola o riga per volta.
I cambiamenti effettuati al Livello di Testo OCR non sono gli stessi effettuati utilizzando lo strumento Correggi Testo dal momento che i cambiamenti al Livello di Testo OCR non avvengono anche al testo visibile.
Inoltre, lo strumento Correggi Testo è adatto alla correzione di piccoli errori, e non per la riformattazione di un documento. Per fare ciò, bisogna esportare il documento in formato Word, ed effettuare i cambiamenti in un word processor.
|