martedì 23 febbraio 2016

Statistica (5/19): Distribuzioni di frequenza

La frequenza è il numero di volte che un certo valore o categoria, compare in uno specifico inseme di dati.

La distribuzione di frequenza può essere rappresentata in tabella o con un grafico, mettendo in relazione i valori/categorie con le frequenze corrispondenti.

In alcuni casi può essere utile raggruppare i valori in classi (distribuzione di frequenza in classi). Ad esempio le età da 18-27 anni, 28-37, ecc...
Quando si sceglie di fare questo tipo di distribuzione, questa dovrebbe avere un minimo di 5 classi ed un massimo di 20, e le varie classi dovrebbero avere la stessa ampiezza, e non deve esserci ambiguità di appartenza dei valori, ovvero un valore o è in una classe o è in un'altra.
Queste classi vengono definite limiti tabulari, ci sono poi i limiti reali che si calcolano sottraendo al limite tabulare inferiore la metà dell'unità di misura, e sommando questa al limite tabulalare superiore.
Il valore centrale di una classe invece, si calcola facendo limite max + limite minimo diviso 2 (tabulare o reale, è uguale).
L'ampiezza della classe invece si calcola con la classe reale sottraendo limite max - limite min.

Limiti tabulari limiti reali Valore centrale
Ampiezza classe
1-4 0.5-4.5
2.5
4
5-8 4.5-8.5
6.5
4
9-12 8.5-12.5
10.5
4

La frequenza relativa è la proporzione tra la frequenza ed il numero totale di valori analizzati.
Ovvero se ci sono 20 valori, e la frequenza del valore che sto esaminando è 5, la frequenza relativa è uguale a 5/20 = 0.25

La percentuale si ottiene moltiplicando la frequenza relativa per 100, ovvero nell'esempio di prima:

percentuale = (5/20)*100 = 25%

La frequenza comulata si calcola prendendo il valore della frequenza in esame e sommandogli tutti i valori delle frequenze ad esso inferiori (vedi tabella).

Categoria Frequenza Frequenza cumulata
rosso 6
verde 3 9
blu 5  14
giallo 4  18

La frequenza cumulata non può essere calcolata sulle scale nominali, perchè queste non possono avere i valori ordinati.

La frequenza cumulata relativa e la percentuale cumulata si calcolano come per la frequenza normale.

In generale, la variabile viene rappresentata con la lettera x (x1,x2,x3).
La frequenza invece con la lettera f (f1,f2,f3).
Il totale dei valori con la lettera n.
La frequenza cumulata con la sigla fc.

Quindi per esempio:

x1 -> f1 -> fc1=f1 -> frequenza relativa = f1/n -> percentuale = (f1/n)*100
x2 -> f2 -> fc2=f1+f2 ....
ecc..

Le frequenze possono essere rappresentate sia con tabelle che con grafici, ma solo con le tabelle si può risalire in modo immediato alla frequenza esatta.

Campo di variazione
Si calcola prendendo il valore maggiore di X meno il valore minore X e sommando uno.
Es: 15 - 20 - 34 - 56 -80
Campo di variazione = 80-15+1 = 66

Asimmetria
As=3*(media-mediana)/deviazione standard

NdE
Il numero di classi di equivalenza (NdE) è il numero di categorie che si incontrano effettivamente in una variabile.
Es: genere (maschio,femmina) -> NdE=2

<< Lezione precedente - Prossima lezione >>

 

Torna all'elenco delle lezioni

 

Piaciuto l'articolo? Lascia un commento!

EmoticonEmoticon