In che modo l’informatica è diversa dalla scienza dei dati?

La scienza dei dati non è una scienza e nemmeno una cosa vera e propria; è solo un termine da 50 centesimi per l'analisi dei dati, che è il processo di derivare informazioni (azioni, comprensione significativa) dai dati, e tipicamente un sacco di dati. Per R&S e scopi accademici, "scienza" ha un bel suono, ma tutte le scienze formano ipotesi e conducono esperimenti e/o osservazioni per determinare la correttezza delle ipotesi. La "scienza" dei dati usa metodi speculativi per tentare di trovare conclusioni nuove e in gran parte non cercate. Se volessi sapere dove dovrei mettere le patatine nel mio negozio di alimentari, l'analitica può aiutarmi a rispondere a questa domanda, ma non a un livello scientifico di certezza. L'analitica presuppone che la correlazione sia sufficientemente vicina alla causalità, quindi finirò per mettere le patatine accanto alla birra. Se le mie vendite di patatine salgono, siamo tutti contenti. I valori P non entrano mai in gioco. Posso aver usato l'apprendimento automatico e/o la statistica per fare questa determinazione, ma posso solo dimostrare la correlazione. Questo va bene; non tutte le cose possono o devono essere studiate scientificamente.

L'informatica è un campo ampio che studia la natura del calcolo, la sua implementazione e la sua applicazione. L'analisi dei dati è una di queste applicazioni. Le persone affermeranno correttamente che l'analitica dei dati è un campo interdisciplinare, ma lo è anche l'informatica, quindi non sono sicuro del punto.

Infine, analitica dei dati e matematica, blah, blah, blah, la matematica non è la parte importante. Ciò che è importante è l'applicazione dei metodi di ricerca quantitativa delle scienze sociali, che usano la statistica. Sempre più spesso, troviamo che i modelli matematici possono essere sostituiti e/o manipolati per dimostrare (piuttosto che studiare effettivamente) un risultato predeterminato. Questo è male. Molto male. Nelle scienze, si chiama p-hacking. Tanta applicazione della tecnologia informatica, inclusa l'analisi dei dati, è un pio desiderio, piuttosto che una valida comprensione del mondo. Non si può prevedere o capire il comportamento umano senza prima capire gli esseri umani. Ci sono applicazioni di data analytics che vanno oltre i dati umani, ma sono rare.