Statistica (11/19): Probabilità

Con il calcolo delle probabilità si fa uso di una statistica che permette di fare inferenze su una popolazione, a partire dai dati raccolti.
Stiamo parlando della statistica inferenziale.

Quando facciamo un'indagine, la teoria della probabilità, ci consente di quantificare il suo grado di incertezza.
Si definisce inoltre, un esperimento casuale (o aleatorio), qualsiasi esperimento del quale non si conosce l'esito prima che si verifichi.
In questo frangente, si definisce spazio campionario, l'insieme di tutti gli eventi possibili dell'esperimento, ovvero il numero totale di casi possibili (es, faccio cadere il telecomando, le possibilità sono: si rompe, o non si rompe, oppure, ad un esame si iscrivono in 100, lo spazio casuale sarà uguale a 100).
Quando si vuole calcolare le probabilità di più eventi contemporanei, si utilizzerà il calcolo combinatorio.

Un singolo evento appartenente al campo combinatorio, viene definito semplice, quando invece quel evento rappresenta un sott'insieme dello spazio combinatorio, ovvero è dato dall'insieme di 2 o più risultati, tale evento è detto composto.

Avendo un evento A, abbiamo la probabilità che l'evento si verifichi (probabilità di successo), indicata con p(A), ed una probabilità che l'evento non si verifichi (probabilità di insuccesso), indicata con q(A).
Tutto ciò che non rappresenta l'evento A, viene detto evento complementare, dato che si trova nello stesso spazio campionario di A.

Esistono 2 definizioni di probabilità, classica (detta a priori) e frequentista (o empirica).

Secondo la definizione classica, la probabilità viene stabilita in termini di proporzioni, facendo il rapporto tra il tra gli eventi favorevoli (k) e gli eventi possibili (n).

p(A) = k/n

Il risultato sarà un numero compreso tra 0 ed 1.
Zero come risultato vuol dire che si tratta di un evento impossibile, ovvero che non c'è nessuna possibilità che l'evento avvenga.
Ovviamente non possiamo avere risultati negativi, perchè vorrebbe dire avere meno di zero possibilità.
Uno, vorrà dire che l'evento è certo.
Ovviamente non possiamo avere risultati maggiori di uno, perchè vorrebbe dire avere un evento più che certo.
Se si vuole rappresentare il risultato in termini percentuali, si moltiplica il risultato trovato per 100.

La somma dei risultati di tutti i possibili risultati o eventi dello spazio campionario è sempre uguale ad 1.

Per calcolare la probabilità di insuccesso, basterà sottrarre la probabilità di successo a 1, ovvero:

q(A) = 1-p(A)

Secondo la definizione frequentistica, si può stabilire il numero di probabilità, facendo delle prove, concludendo l'esperimento e facendo il rapporto tra il numero di successi ottenuti con il numero di prove effettuate.

Queste due definizioni si utilizzano, una in caso si stabilisca prima teoricamente, i valori che definiscono il rapporto tra eventi favorevoli ed eventi possibili, nell'altro caso, i valori del rapporto vengono stabiliti dopo aver effettuato un certo numero di esperimenti.
Per esempio, se dobbiamo calcolare la probabilità che domani ci sia la pioggia o il sole, stabiliamo prima il rapporto casi favorevoli / casi esistenti, in caso si debba calcolare la probabilità che il telecomando si rompa, si fanno le prove con più telecomandi e poi si fa il rapporto.
Quindi, in un caso sono noti gli effetti favorevoli e lo spazio campionario, nell'altro queste informazioni si ricavano dopo l'esperimento.

Probabilità di due eventi

Quando si hanno due o più eventi: la probabilità che si verifichi l'uno o l'altro evento, si dice disgiunta, la probabilità che si verifichino l'uno e l'altro si dice congiunta, la probabilità che si verifichi l'uno a patto che l'altro sia verificato si dice condizionata.

Quando vogliamo stabilire la probabilità disgiunta, si utilizza la regola della somma, ovvero, la probabilità complessiva è data dalla somma delle probabilità dei singoli eventi.

p(A u B) = p(A) + p (B)

La probabilità disgiunta di due eventi, è sicuramente maggiore della probabilità dei singoli eventi in questione.

Occorre cmq valutare si tratta di eventi escludenti o non escludenti.
Se gli eventi sono non escludenti, occorre integrare al calcolo della probabilità disgiunta, la probabilità congiunta.
Ovvero:

p(A u B) = p(A) + p (B) - p(A^B)

Se ad esempio dobbiamo calcolare che probabilità c'è che su 100 cani, quanti saltino un fosso, si usa la formula della probabilità disgiunta.
Se invece bisogna calcolare la probabilità che su 100 cani, i saltanti il fosso siano pastori tedeschi, bisogna combinare sommare le 2 probabilità prese singolarmente, e sottrargli l'insieme comune riferito alla probabilità di base.
Ovvero, sapendo che i cani sono 100, e se i cani che saltano il fosso è 30, e i pastori tedeschi in generale sono 40, e che i cani che saltano il fosso e sono pastori tedesci sono 15.
p(cani che saltano il fosso u pastori tedeschi) = (30/100) + (40/100) - (15/100)

Regola del prodotto
Si usa quando si vuole calcolare la probabilità congiunta di due eventi, e la sua definzione è:
Quando l'evento favorevole è definito da due eventi distinti che devono presentarsi insieme, la probabilità complessiva è data dal prodotto delle probabilità dei singoli eventi.
p(A^B) = p(A) x p(B)
La probabilità ricavata sarà sempre minore rispetto alla probabilità di uno dei singoli eventi.
Nel definire la probabilità di A e di B, occorre però valutare se i due eventi sono indipendenti o dipendenti.
Se gli eventi sono dipendenti tra loro, si utilizza la seguente formula:
p(A^B) = p(A) x p(B|A)
Se ad esempio si estrae a sorte più numeri, bisogna tener presente che ad ogni estrazione il numero totale di eventi possibili diminuirà di uno.
Quindi se dovessimo estrarre 2 numeri su 10, la formula diventerebbe:
p(esce numero1 ^ esce numero2) = (1/10) x (1/9)
Quindi, quando si ha la dipendenza bisogna usare questa formula, mentre quando non c'è dipendenza si usa quella semplice.
Tuttavia ci sono dei casi in cui gli eventi da calcolare sono pochi ed il campio è molto elevato, in tal caso si può anche far finta che non ci sia dipendenza.
Per poter riutilizzare sempre la formula semplice, bisognerebbe reinserire il campione estratto ad ogni giro, ma nella pratica raramente si esegue un reinserimento, dato che non avrebbe senso ripescare lo stesso elemento più volte.
In alcuni casi, vengono abbinate sia la regola della somma che quella del prodotto.

Probabilità condizionata
Negli eventi dipendenti, la probabilità condizionata è quando, perchè ci sia un evento, se ne deve verificare un altro.
se p(A ^ B) = p(A) x p(B|A) allora p(B|A) = p(A ^ B) / p(A)
Tornando all'esempio dei cani, per calcolare la probabilità che un cane sia pastore tedesco, sapendo già che ha saltato il fosso, si fa:
p(pastore tedesco | saltato fosso) = p(pastori che han saltato fosso) / p(saltato fosso)
Se due eventi sono indipendenti, il fatto che uno si sia verificato, non modifica la probabilità che l'altro si verifichi o non si verifichi.

In un esperimento, affinchè un campione sia casuale ogni soggetto deve avere la stessa probabilità di entrare a farne parte.

Oggi è un altro post

mercoledì 9 marzo 2016

Probabilità di due eventi

<< Lezione precedente - Prossima lezione >>

Torna all'elenco delle lezioni