Ci sono molte librerie OCR disponibili per l'integrazione con Android - Tesseract è molto usato. Dalla mia esperienza, l'estrazione su OCR non è generalmente così grande. Quindi quello che dovresti fare è - fare un test di estrazione di base su Android per assicurarti che l'immagine sia stata presa correttamente, non abbia un tremolio, ecc e poi inviarla a una libreria lato server per un'estrazione più profonda e una pre-elaborazione.
La parte più complicata è cosa fare dopo che il motore OCR ti dà il testo. L'estrazione del testo è molto più complicata di quella dell'OCR. Per l'estrazione del testo, devi preoccuparti di altre due cose:
- Regole di estrazione: I software OCR di solito scaricano il testo del documento in un campo di testo a forma libera. Questo funziona benissimo se si sta scansionando una pagina da un libro o un documento di testo. Ma nel caso abbiate bisogno di separare gli elementi di linea dal documento, allora avete anche bisogno di applicare molte regole intorno ad esso. Questo può richiedere molto più tempo dell'integrazione del motore OCR
- Apprendimento automatico: Ottenere il testo OCR è un buon inizio ma dalla mia esperienza nella costruzione di soluzioni OCR, questo valore di per sé non è molto utile. È necessario combinarlo con altri fattori e inserirlo in un algoritmo che possa imparare dai risultati dell'estrazione nel tempo e usarlo per prevedere quale sia il testo giusto.
Per le applicazioni aziendali, ci sono situazioni in cui il motore OCR è abbastanza sicuro dei dati estratti ma il testo non ha senso nel contesto di tutti gli altri dati che lo circondano. È qui che i motori OCR classici falliscono. Molte aziende sono state in grado di aggirare questo problema costruendo forti algoritmi di testo basati sull'apprendimento automatico che possono colmare il divario nella leggibilità del motore OCR.