A cosa serve la statistica?

 A cosa serve la statistica?

Parliamo un momento del motivo per cui serve la statistica.

Facciamo un esempio che nel primo periodo pandemico era così quotidiano da essere l'argomento più discusso. I dati.

La statistica (anche solo una semplice introduzione) permette di essere coscienti di quello che leggiamo in questi fatidici dati.

Innanzitutto, i dati senza un'incertezza quantificata, sono inutili.

Diciamo che io vada all'ASL e chieda:

-"Buongiorno, quante persone positive ci sono state oggi?"

-" Ci sono 1002 persone positive oggi signore."

-" Grazie, ma quanto è accurato dato?"

-" Prego? Le abbiamo contate sono 1002"

Ebbene, il test di positività è un dato certo? No, è affetto da incertezza (Guarda il test di ipotesi, ti spiegherà cosa sia un falso positivo e cosa un falso negativo!). L'incertezza non è la deviazione standard, ma le due hanno a che fare; il discorso è lungo, perciò lo vedremo un'altra volta.

Inoltre, i dati sono stati raccolti a mano. Quant'è probabile che ci sia stato un errore umano? Più persone hanno manipolato (cioè scritto, inviato, elaborato, ... ) i dati, più questa probabilità cresce.

Ci tengo a dire che questa NON è una critica nei confronti delle istituzioni, bensì un'osservazione su come i notiziari diffondano informazioni certamente parziali, se non con alcune chiavi di lettura preferenziali.

Questa evidenza dovrebbe mostrare perché la statistica non è solo importante, ma fondamentale nella vita delle persone. Ogni dato che vi viene fornito ha un'incertezza (e anche l'incertezza può avere l'incertezza!). Sembrerà tutto incasinato, perciò facciamo un ultimo esempio.

Ti dirò che, se mi affidi i tuoi risparmi, hai il 70% di possibilità di vederli triplicati in un anno, il 20% di vederli raddoppiati e il restante 10% di perderli.

Wow, sembra un affare abbastanza buono, nel 90% dei casi guadagnerò bei soldi. Ma, aspetta, queste percentuali da dove arrivano? Chi le ha calcolate? Come

Magari sono percentuali vere. Ma diciamo che abbia avuto 10 clienti e le abbia calcolate io, basandomi sul fatto che 7 di loro li hanno triplicati, 2 raddoppiati e 1 è andato in bancarotta. Ti fidi ancora così tanto? be', io non lo farei.

Perché? Perché 10 sono pochissime persone. Potrebbe tranquillamente essere una fluttuazione statistica di "fortuna". E se le vere probabilità fossero 60%, 20% e 20%? Non sarebbe più così meraviglioso, 1 su 5 perde tutto. Questa può non essere malizia, ma le percentuali non sono abbastanza. Giustamente, più il campione cresce, più le fluttuazioni casuali saranno basse e l'incertezza  sui valori si abbasserà. Sarebbe simile all'esperienza dell'investitore, anche se esistono dei modi per valutare anche questa cosa nella statistica (entriamo nel merito della statistica Bayesiana, discorso più lungo, e anche questo lo rimanderemo).

Ricorda infine che, nel bene e nel male, se ti diranno " esiste una possibilità su 100.000" quella possibilità può essere al primo come all'ultimo tentativo. Questo non lo puoi sapere. Sembra così semplice che spesso si dimentica.


Se ti è piaciuto il post e ti interessa una discussione più approfondita, lasciamo un commento con cosa ti piacerebbe discutere. Ad esempio, cosa sia la statistica Bayesiana, l'incertezza e la varianza, l'errore sperimentale o qualcosa che ti interessa scoprire a cosa può servire.

Ciao e buona lettura sul blog!

Comments