Non lo so. Ma lasciami indovinare.
Prima di tutto, ci sono un paio di cose sulla scrittura dei caratteri cinesi che potresti usare a tuo vantaggio:
- il numero di tratti.
- c'è un ordine giusto per i tratti.
- ogni tratto ha un posto dove inizia e finisce.
- ogni tratto ha un percorso che traccia.
Immagino che si possa avere un buon successo semplicemente dividendo lo spazio di scrittura in una griglia molto approssimativa, e per ogni tratto, tenere traccia di dove inizia e finisce. Poi contare il totale dei tratti.
Si potrebbe raffinare da lì, ma non deve essere perfetto, dato che si presentano le scelte alla fine. Come bonus, potresti cambiare l'algoritmo, dato che hai un buon modo per determinare il successo dell'algoritmo: la percentuale di tempo in cui appare il carattere corretto, e la percentuale di tempo in cui il carattere appare come prima scelta.
Ma la mia ipotesi è che un algoritmo ingenuo come questo funzionerebbe abbastanza facilmente.
Incidentalmente, i dizionari di caratteri giapponesi a volte sono organizzati prima per numero di tratti, poi per componenti. Ci sono un insieme standard di componenti e un ordine standard per essi.
Ho scritto un software per riconoscere i numeri inglesi e ho usato una strategia simile.