Questo è un problema molto più difficile di quanto la maggior parte delle persone si renda conto perché il PDF è poco più di un flusso di comandi di disegno (fondamentalmente un file .ps) insieme a qualsiasi font necessario, immagini o altre risorse. Il PDF è pensato per le stampanti, non per gli esseri umani, quindi mentre riproduce fedelmente i contenuti su vari dispositivi, il formato non ha una comprensione profonda di cosa siano quei contenuti. Non è come l'HTML dove i contenuti sono solo stilizzati da tag - in PDF, il disegno di ogni carattere è un comando separato, e potrebbero potenzialmente arrivare in qualsiasi ordine ed essere ancora validi.
Quando ho scritto il supporto PDF per un'app per iPad, ho dovuto fondamentalmente disporre ogni pagina in memoria e osservare quali caratteri erano vicini l'uno all'altro e più o meno sulla stessa "linea" per supportare la ricerca e l'evidenziazione. Scavare in profondità nei PDF è un incubo assoluto, ed è da evitare se possibile.
Se avete solo bisogno di supportare iOS, PDPDFKit (http://pspdfkit.com) è la strada da seguire. È ampiamente utilizzato ed è stato sviluppato per molto tempo, quindi è collaudato in battaglia.