La risposta a questa domanda dipende in una certa misura dal vostro caso d'uso. State mirando alla dettatura di un ampio vocabolario (pensate a dettare un'email, un messaggio di testo, o qualcosa di simile) o al supporto di compiti specifici (command&control, piccoli dialoghi, ecc.), avete bisogno solo del riconoscimento vocale o di più di questo (comprensione del linguaggio naturale, gestione dei dialoghi, ecc.), che tipo di informazioni avete bisogno dal risultato del riconoscimento vocale, ecc. Come suggerito da alcune risposte precedenti, ci sono soluzioni offline dove tutto viene eseguito sul dispositivo così come soluzioni basate su cloud fornite da grandi aziende tecnologiche (Amazon, Google, Microsoft, ecc.) e alcune startup.
La mia azienda offre anche SDK per il riconoscimento vocale su dispositivo (offline) per dispositivi iOS e Android. Offriamo anche una varietà di modelli acustici che possono essere ottimizzati per una popolazione specifica (bambini contro adulti, ecc.) e ambienti acustici. L'SDK è altamente personalizzabile ed è già utilizzato in una varietà di applicazioni iOS e Android.
Più dettagli su https://keenresearch.com