Test di ipotesi. Esempio di test per una media

Test di ipotesi

 Filosofia del test

Il test di ipotesi trova vaste applicazioni nelle scienze. In particolare, viene utilizzato, ad esempio in fisica, per analizzare se una teoria predica in modo significativamente diverso da un'altra un risultato, oppure per valutare se delle evidenze "estreme" siano considerabili come parte della componente aleatoria del fenomeno o se siano da attribuire a limiti del modello. Ad esempio, ipotizziamo di pesare 100 persone, e di trovarle con peso medio 80 kg e varianza campionaria 400 kg^2 (si noti che la varianza non possiede la stessa unità di misura della media. La varianza viene usata per le sue proprietà matematiche di combinazione, non per il suo senso fisico). Potremmo perciò ipotizzare che il peso sia una variabile aleatoria, con distribuzione normale ( n=100 è un buon numero ) Peso~N(80,400).

Troviamo poi una persona che pesa 300 kg e una che ne pesa 10. La domanda sarà: queste due pesate sono compatibili con l'ipotesi di distribuzione normale? O sono valori così estremi che rendono questa ipotesi non accettabile?

Allora, procediamo con il testi di ipotesi.

Prima di approcciare direttamente il test, è necessario definire i parametri del test.

Chiamiamo H0 ipotesi nulla e H1 ipotesi alternativa

Il test è conservativo per H0. Per spiegare questa cosa, supponiamo di confrontare la teoria di Newton (brutalmente, F=m*a) con la teoria della Relatività ristretta. Diciamo che la teoria del moto classico funziona estremamente bene a velocità sub-luminari (lontano dalla velocità della luce), ma a velocità elevate i risultati sperimentali non vengono più predetti accuratamente. Come facciamo a decide se questa teoria è da scartare? Con un test.

Distinguiamo 4 possibilità:

  1. H0 è vera e viene accettata. Bene, è giusto.
  2. H0 è falsa e viene rifiutata. Bene, anche questo è giusto.
  3. H0 è falsa e viene accettata. Si dice errore di prima specie, indicato con alfa.
  4. H0 è vera e viene rifiutata. Generalmente questa è la condizione che si apprezza di meno (equivale ad accettare l'ipotesi alternativa H1 quando questa è sbagliata). Questa probabilità viene indicata con beta ed è l'errore di seconda specie.
La Potenza del test è il valore P=1-beta. Alfa e beta non sono indipendenti, quindi scegliere uno equivale a scegliere anche l'altro.

Bene, ora abbiamo un po' di strumenti per fare un test di ipotesi semplice.
Ad esempio, consideriamo il caso di una grandezza, ad esempio il peso della popolazione, che abbia una certa distribuzione normale, con media m_v=85 kg . Ci chiediamo se è plausibile ottenere da un campione di n=10 una media m_c= 83 kg e dev. std. s= 20 kg.
Sarà vero che m_v=m_c? O saranno diverse? La domanda sembra strana, ma se ci riflettiamo un attimo, può essere che 80 sia una media trovata "per caso" perché abbiamo preso un campione troppo piccolo e quindi la fluttuazione statistica è molto alta. Un altro esempio potrebbe essere quello di pesare 100 monete, trovare che pesano 5 grammi, per poi pesarne altre 3 e trovare che pesano 4.89 grammi. Saranno uguali o diverse?
In questo caso si esegue un test a due code, ovvero bisogna identificare in quale intervallo di valori  diciamo che la media trovata è uguale a m_v, e al di fuori del quale diciamo che sono diverse. Questo intervallo è marcato dal p-value, valore che indica la probabilità che la nostra media " fuori media " appartenga all'ipotesi nulla. Più è basso, meno sarà probabile che il nostro valore sia compatibile con l'ipotesi nulla.
Per fare il test si fissa il livello di significatività alfa che è la soglia per il P-value sotto la quale l'ipotesi nulla si rifiuta.
Ad esempio, alfa=0.1 è il corrispettivo di una richiesta "morbida", vuol dire che le due medie dovranno essere molto vicine tra loro, altrimenti diremo immediatamente che siano diverse.
Il valore convenzionale è alfa=0.05.

Proseguiamo con l'esempio:
H0 : m_v=m_c
H1: m_v!=m_c

H0 equivale a dire che m_v-m_c=0. Diciamo perciò che Z sarà la nostra variabile aleatoria, di media zero e gaussiana, definita come Z= m_v-m_c/(s/rad(n)) 
Scegliamo il livello di significatività = 0.05 ad esempio. Siccome il test è bilaterale, i limiti di validità saranno dettati così: La probabilità esterna ad H0 dev'essere uguale ad alfa. Perciò, siccome posso stare sia sopra che sotto, alfa dev'essere diviso a metà sui due intervalli.
Perciò andremo ad accettare l'ipotesi nulla se P(X<-Z)<alfa/2 o equivalentemente se P(X>Z)<alfa/2
Per calcolare la probabilità si usano le tavole statistiche.










Comments

Popular posts from this blog

A cosa serve la statistica?