Qual è il software OCR più potente e preciso per il testo giapponese?

La mia esperienza è che non esiste un singolo pacchetto software OCR che superi costantemente tutti gli altri sul testo giapponese. Le prestazioni possono variare ampiamente a seconda di una serie di fattori, tra cui la qualità dell'immagine, la risoluzione di scansione, i caratteri utilizzati, il layout e il tipo di file (gif, png, jpg, pdf, ecc.). Io uso tutti i seguenti per l'OCR giapponese:

  • Adobe Acrobat: Questa è una scelta ovvia per i traduttori perché in generale è necessario abbonarsi ad Adobe Acrobat per il proprio lavoro. Per eseguire l'OCR in Adobe Acrobat, aprire il file immagine in Acrobat e scegliere Strumenti -> Scansione e OCR -> Apri: Questo è uno dei migliori strumenti OCR, e soprattutto è completamente gratuito. Carica il file immagine su Google Drive, fai clic destro su di esso e scegli Apri con Google Docs. L'immagine viene visualizzata nella parte superiore del documento, e il testo riconosciuto appare sotto di essa. Sfortunatamente, Google Docs non fa alcuno sforzo per preservare l'aspetto e la formattazione del testo, che è un grande svantaggio rispetto agli altri software qui elencati.
  • Readiris 17: Readiris è un software OCR commerciale per Windows e Mac venduto da IRIS, una società Canon. A partire da soli 49 dollari, è un relativo affare. Si carica il file immagine in Readiris, si specifica la lingua, e poi si salva come PDF ricercabile. Si noti che non accetta file GIF.
  • 読取革命 (Yomitori Kakumei): Questo è l'unico software elencato qui che è specifico per la lingua giapponese. Anche l'interfaccia e la documentazione sono solo giapponesi. Con un prezzo di 12.980 JPY, è l'opzione più costosa qui. 読取革命 è stato originariamente sviluppato da Panasonic ed è ora venduto da SourceNext.

Ancora una volta, la mia esperienza è che non c'è un unico chiaro vincitore, ed è difficile prevedere quale software darà i migliori risultati OCR su un dato file immagine. Di solito inserisco il file di immagine scannerizzato in tutti e quattro, e diventa rapidamente ovvio quale lo gestisce meglio.