Statistica (14/19): La verifica delle ipotesi

La verifica dell'ipotesi nell'ipotizzare che un determinato fenomeno abbia specifiche caratteristiche nella popolazione.
La statistica inferenziale attraverso ragionamenti di tipo probabilistico consente di avere informazioni su popolazioni che non possiamo conoscere in modo esaustivo.
A causa delle scelte fatte in base al calcolo delle probabilità, queste sono comunque soggette ad errori.

Per condurre la ricerca bisogna dunque formulare delle ipotesi.
Si avranno due ipotesi:

Ipotesi nulla: H₀ esprime sempre una relazione di uguaglianza ed è l'ipotesi che dobbiamo far cadere per confermare le nostre teorie, è ad esempio l'ipotesi che non ci sia differenza tra una media di un campione e la media della popolazione.
Ipotesi alternativa: H₁ esprime una relazione di disuguaglianza ed è l'ipotesi che vogliamo dimostrare, che viene presa per vera se cade l'ipotesi nulla.

Bisogna ricordare inoltre che un'ipotesi può essere falsificata ma non verificata e che cmq traiamo sempre conclusioni di tipo probabilistico.

Test statistici e distribuzione campionaria

I test statistici consentono di riferire il dato campionario a distribuzioni di probabilità note, in modo da associare a tale dato un valore di probabilità.
Le distribuzioni di riferimento sono quindi distribuzioni campionarie delle statistiche in esame.
La distribuzione campionaria per campioni con n>30 è normale.
Questo significa che man mano che ci si allontana dalla media, le frequenze decrescono, si hanno pochi campioni che hanno una media molto inferiore o superiore a quelli della popolazione.

Quello che bisogna scoprire è se nel caso di medie diverse da campione a popolazione, se si tratta di una differenza aleatoria ovvero dovuta al fatto che si sta lavorando su un campione estratto casualmente e per caso questi campioni sono diversi dalla media, oppure se il campione in esame appartiene proprio ad una popolazione diversa.

Livello di significatività di α

Per decidere la validità dell'ipotesi nulla occorre fissare un livello di probabilità minimo entro il quale l'ipotesi deve essere mantenuta o rifiutata.
Il concetto di bassa priorità a priori suggerisce che se non si supera la probabilità del 5%, ovvero p<=.05, l'ipotesi nulla viene respinta.
Un criterio ancora più restrittivo è quello del 1% ovvero p<=.01, o addirittura dello 0.1% ovvero p<=.001.
Il valore di probabilità prefissato α viene detto livello di significatività, e rappresenta il limite oltre il quale respingere l'ipotesi nulla.
Scegliendo il livello di significatività stabiliamo quindi la probabilità dell'errore che accettiamo di correre nel prendere la nostra decisione.
Nella ricerca psicologica il livello di significatività mediamente accettato è 5%.

Disegnando la curva di gauss si potrà delinerare una zona di rifiuto che contiene quei risultati che possono essere considerati improbabili posta vera l'ipotesi nulla.

Ricapitolando:

Se p>α accettiamo l'ipotesi nulla H₀
Se p<=α rifiutiamo l'ipotesi nulla e accettiamo l'ipotesi alternativa H₁

Test monodirezionale o bidirezionale

Formulando l'ipotesi alternativa occorre indicare se questa è monodirezionale o bidirezionale.
Nel caso si dica semplicemente che si tratta di diversità tra popolazioni, si farà un'ipotesi bidirezionale e si useranno i test bidirezionali (detti a due code, dato che la regione di rifiuto dell'ipotesi definita da alpha, viene divisa equamente nelle due code della distribuzione), nel caso ci sia un atteggiamento positivo o negativo, si farà un'ipotesi monodirezionale e i test statistici utilizzati saranno quelli monodirezionali (o a una coda, dato che la regione di rifiuto si colloca in una delle due code della distribuzione).
Nelle monodirezionali se la differenza è maggiore l'ipotesi è monodirezionale destra, se è minore è monodirezionale sinistra.

In psicologia solitamente si formulano ipotesi monodirezionali, e i risultati che vanno esattamente nella direzione opposta danno indicazioni per modificare le impostazioni generali della ricerca o della teoria dalla quale sono partiti.

La decisione

Accettare o rifiutare un'ipotesi, non significa aver provato con certezza che questa sia vera o falsa, ma significa che le informazioni ottenute, viste in termini probabilistici, non supportano il suo rifiuto o la sua accettazione.
In ogni decisione di tipo statistico esiste sempre la possibilità di commettere un errore.

Tabella delle decisioni:

		REALTA'	REALTA'
		H₀ è vera	H₀ è falsa
Decisione presa	H₀ è vera	Decisione corretta: Non rifiutare l'ipotesi nulla che è vera (1-α)	Errore di tipo 2: Non rifiutare l'ipotesi nulla che è falsa (β)
Decisione presa	H₀ è falsa	Errore di tipo 1: Rifiutare l'ipotesi nulla che è vera (α)	Decisione corretta: Rifiutare l'ipotesi nulla che è falsa (1-β)

1-α è la probabilità di accettare correttamente l'ipotesi nulla quando è vera.
1-β è la probabilità di respingere correttamente l'ipotesi nulla.
1-β è la potenza del test statistico ed esprime in termini probabilistici la capacità del test di portare ad una decisione corretta sull'ipotesi alternativa.

Tanto più si restringe α e tanto più β aumenta, e viceversa.
Se si mantiene basso il livello di significatività, si diminuisce la potenza del test.

Se il campione con il quale stiamo lavorando è piccolo, o/e la variabilità osservata è elevata, aumenta la probabilità di commettere un errore nel trarre la nostra conclusione.
Quindi, non potendo ottenere un sistema infallibile si cercherà di massimizzare la sua efficacia e minimizzare gli effetti di una decisione scorretta.

Concludendo si può affermare che tenendo basso α, si limitano gli errori di tipo 1, accettando così di innalzare β, ovvero di aumentare la probabilità di commettere errori di tipo 2.
Questa è una procedura non infallibile ma affidabile, cioè una potenza di test sufficientemente elevata.