Attendibilità e validità (2/4): L'interpretazione dei punteggi

Misurare in psicologia
Misurare è il processo di assegnazione di numeri ad oggetti in modo tale che le caratteristiche di questi ultimi siano fedelmente rappresentate dai numeri (Krantz).

Differenze individuali
L'obiettivo dei costruttori dei test psicologici è quello di mettere a punto delle procedure per trasferire le differenze psicologiche in differenze di tipo quantitativo e numerico.
Tuttavia i test psicologici ci dicono solo il modo in cui gli individui si assomigliano o sono differenti tra loro, senza però esprimere giudizi di valore.

Scale di misura
La scala di misura è l'insieme dei numeri o simboli le cui proprietà rispecchiano le proprietà empiriche degli oggetti alle quali sono stati assegnati dei numeri.
Distinguiamo 4 principali scale:

Scala nominale: consiste nel classificare o categorizzare le persone sulla base di una o più caratteristiche distintive rispetto alle quali esse vengono messe in categorie mutuamente escludentesi ed esaustive.
Si possono quindi misurare numeri e nomi, e le uniche operazioni aritmetiche effettuabili sono il calcolo del numero dei casi di una categoria (frequenze), in proporzioni o percentuali.
Scala ordinale: Consente di effettuare classificazioni come la nominale, ed inoltre di ordinarle e gerarchizzarle secondo i livelli di grandezza.
Questa scala non ha uno zero assoluto e non dispone di unità di misura, e i dati di queste scale possono quindi essere ordinati, ma non è possibile sottoporli ad operazioni di tipo aritmetico.
Scala a intervalli: ha tutte le caratteristiche delle precedenti scale, inoltre permette di valutare la differenza tra i vari valori misurati, in quanto i valori hanno un intervallo uguale tra di loro ed una unità di misura, ma non hanno uno zero assoluto e questo vuol dire che il valore zero non equivale all'assenza del valore (ad esempio peso zero non vuol dire niente peso), quindi non si può affermare con certezza che il valore 40 in questa scala equivale al doppio del valore 20.
Le operazioni aritmetiche effettuabili sono la somma e la sottrazione, e sono applicabili tutti i possibili calcoli statistici (media, deviazione standard, correlazione, ecc...).
Scala a rapporto: il valore zero non è arbitrario ma indica la reale assenza della proprietà in esame, e quindi questa scala oltre ad avere tutte le proprietà delle precedenti, consente di rappresentare la grandezza della differenza tra 2 elementi misurati, quindi i rapporti tra i valori scalari corrispondono a quelli tra le caratteristiche misurate.

Misure della tendenza centrale
La moda corrisponde al punto più alto in un poligono di frequenza, ovvero al valore più numeroso nei risultati.
La mediana è quel punteggio che separa in due parti uguali una distribuzione.
La media equivale alla somma di una serie di punteggi divisa per il numero totale degli stessi: M=(∑x_i)/n

Misure della variabilità
La variabilità è la dispersione dei punteggi intorno alla media.
I quartili dividono in 4 parti un gruppo di punteggi, in modo che il 25% di essi cada in ognuna di queste parti, ed i punteggi che delimitano le 4 parti sono detti punteggi interquartilici e vengono rappresentati con le lettere Q₁, Q₂ e Q₃.

Deviazione standard
La varianza è la media aritmetica dei quadrati delle differenze tra i punteggi di una distribuzione e la loro media (scarto quadratico medio):

formula

La varianza si usa molto quando si cerca di valutare l'influenza di fattori diversi nel determinare le differenze individuali.
La deviazione standard è invece usata per confrontare la variabilità di gruppi diversi di punteggi e per eseguire inferenze a grandi popolazioni a partire da misure su piccoli campioni:

formula

Una piccola deviazione standard indica che i valori trovati tendono a raggrupparsi intorno alla media, e quindi più è grande la deviazione standard e più è maggiore la variabilità tra gli individui.

Interpretazione dei punteggi di un test
Il punteggio grezzo è la somma delle risposte corrette di un individuo.
Sia i punteggi grezzi che quelli individuali non possono essere interpretati se non vengono trasformati in misure ponderate riferibili a norme, devono quindi essere messi in rapporto con la distribuzione dei punteggi ottenuta da un gruppo di soggetti chiamato campione di standardizzazione.

La standardizzazione
La standardizzazione implica l'uniformità delle procedure di somministrazione del test e della determinazione del punteggio, e la determinazione delle norme statistiche del test.
Il punteggio grezzo di un singolo può essere valutato solo se messo a confronto con quello di altri individui suoi simili, e per ottenere delle norme statistiche il test va quindi applicato ad un ampio campione di soggetti selezionati in modo da risultare rappresentativi della popolazione.
Per norma si intende la misura della tendenza centrale della distribuzione di punteggi ottenuti dal campione di standardizzazione (media), ma anche la misura della variabilità.

Tipi di campioni normativi
Le norme non possono mai essere considerate assolute, ma ci si può fidare di più parametri relativi a popolazioni specifiche, non troppo ampie, delle quali il campione risulti molto rappresentativo.
La prestazione individuale ad un test solitamente presenta un certo grado di dispersione.

Modalità di rappresentazione delle norme
Le norme di un test rappresentano la prestazione ottenuta in esso dal campione di standardizzazione, dove il punteggio grezzo di ciascun soggetto viene messo in relazione con la distribuzione dei punteggi ottenuta dal campione di standardizzazione, per vedere dove esso si situa all'interno di quella distribuzione.
Per ricavare l'esatta posizione il punteggio grezzo deve essere trasformato in una unità di misura relativa, permettendone così la valutazione rispetto ai punteggi di altri soggetti.
La più semplice trasformazione dei punteggi è quella percentuale, la quale ha 3 caratteristiche principali: esprime il punteggio individuale in diverse unità senza alterarlo, tiene conto di informazioni non strettamente contenute nel punteggio grezzo, i punteggi trovati sono espressi in maniera più interpretabile.

Punti centili e ranghi centili
Per poter confrontare le prestazioni di punteggi di soggetti numericamente diversi occorre trovare il rango di ogni punteggio, disponendoli in ordine di grandezza ed assegnando il valore 1 di rango al punteggio più alto, e scalando di conseguenza.
I ranghi devono essere espressi in termini relativi.
Secondo Guilford, il rango centile RC indica la posizione in una graduatoria di 100 posizioni, dove a differenza del rango normale, il rango centile più basso corrisponde alla prestazione più bassa (quindi 100 è il massimo e 1 il minimo).
La formula di Galton per il calcolo del rango centile è la seguente:

formula

Dove N è il numero dei punteggi totali e G è il posto in graduatoria del soggetto.

Un'altra formula è quella di Glaparède:

formula

Nel calcolo dei ranghi centili, gli arrotondamenti vengono sempre fatti all'unità immediatamente superiore al risultato trovato.
Quando i punteggi però sono molti, spesso si raggruppano in classi attraverso una tavola di frequenze, e si usa la seguente formula per calcolare i ranghi:

formula

Dove X è il punteggio grezzo, L_i è il limite inferiore reale della classe di punti grezzi, i è l'intervallo della classe, f_i è la frequenza della classe di appartenenza, f_c è la frequenza cumulativa appena sotto all'intervallo considerato, N è il numero totale di punti/soggetti.

Il metodo statistico per il calcolo del rango invece:

formula

Punti centili
Il punto centile viene definito come il punteggio in una scala di misure corrispondente ad un certo rango centile.
Il rango centile è quel numero che indica la percentuale di dati che si collocano al di sotto di un certo numero, mentre il punto centile è il punteggio stesso o la misura al di sotto della quale si trova una certa percentuale di dati.
Il 50° centile corrisponde alla mediana della distribuzione, mentre il 25° viene detto primo quartile.
I punti centili si calcolano con la seguente formula:

formula

Dove p.p. indica la posizione del punteggio centile cercato e C indica il punto centile.

In una distribuzione di dati raggruppati in classi si usa invece la seguente formula:

formula

Dove: C_n è il punteggio corrispondente al centile n, n è il centile cercato, X'_inf è il limite inferiore reale della classe che contiene il centile, F_b è la somma delle frequenze delle classi inferiori a quella del centile in questione, f sono le frequenze della classe del centile, i è l'ampiezza dell'intervallo della classe che contiene il centile.

I vantaggi dell'uso dei ranghi e dei centili sono: che si possono calcolare facilmente, permettono di conoscere la posizione di un punteggio in una distribuzione, consentono il confronto tra punteggi di distribuzioni diverse, possono essere usati per tutti i test.
Gli svantaggi: la distribuzione centilica costituisce una tipica scala ordinale, quindi si può sapere se il punteggio è maggiore o superiore ad un altro, ma non di quanto, perchè non si ha l'unità di misura in questa scala, inoltre la trasformazione in centili opera una distorsione nella distribuzione.

Punti z
I punti z (o standard) sono considerati come valori di una scala a intervalli uguali, sui quali si può operare matematicamente e statisticamente.
I punti z definiscono una scala di valor che indicano la distanza di ognuno di essi dalla media della distribuzione, il punto z indica la differenza tra un punteggio grezzo e la media del gruppo, divisa per la deviazione standard, quindi un punteggio z indica di quante deviazioni standard il punteggio grezzo si scosta dalla media del gruppo.
Questa scala ha media 0 e DS=1, e la formula per calcolare il punto z è la seguente:

formula

Se si vuole trasformare il punto z, basta moltiplicarlo per la deviazione standard di una nuova scala e aggiungere o sottrarre il risultato ottenuto dalla media prescelta:
Z=a+b*z
Dove a è la media, mentre b è la deviazione standard.

Le caratteristiche della curva normale
La distribuzione normale è simmetrica, la media, la moda e la mediana si sovrappongono e coincidono con il valore massimo della curva, l'area sotto la curva è uguale a 1.
La distribuzione normale ha media 0 e deviazione standard uguale a 1, inoltre studi matematici hanno permesso di dire che il 68,26% della popolazione è compreso tra + o - 1 DS dalla media, il 95,44% è compreso tra + o - 2 DS, il 99,73% della popolazione cade tra + o - 3 DS.
Per calcolare la probabilità che un punteggio z cada in una certa area della curva, si usano le tavole della distribuzione normale.

Percentili della distribuzione normale
L'84° centile corrisponde al punto z +1 e indica che circa l'84% dell'area sottostante alla curva normale cade a sinistra di questo z, quindi si usa scrivere così: z84=+1.
Dato che z50 coincide con la media, i punti z con valori inferiori a 50 hanno segno negativo.

Punti standard normalizzati
Per permettere la comparazione di punteggi ricavati da distribuzioni non omogenee si convertono i punti standard in punti standard normalizzati.
La normalizzazione consiste in una trasformazione della distribuzione per avvicinarla a una forma normale, trasformazione detta non lineare o di area, dove i punteggi cambiano di significato.
Per normalizzare si seguono i seguenti passaggi:

si mettono i punti grezzi in ordine di grandezza.
si riporta la loro frequenza.
si calcolano le frequenze cumulative.
si calcolano i ranghi percentili di ogni punteggio grezzo col metodo dell'interpolazione lineare.
si trovano i punti z al di sotto dei quali, nella curva di distribuzione normale, cade una percentuale di valori pari ad ogni rango percentile.

Per calcolare il rango percentile col metodo dell'interpolazione lineare si usa la seguente formula:

formula

Dove: R_p(X_i) è il rango percentile di un punteggio X_i, f_co è la frequenza cumulativa immediatamente inferiore al punteggio X_i, f_i è la frequenza corrispondente al punteggio x_i.

Punti T e stanini
Per evitare che i punti standard assumano valori negativi e decimali, essi possono essere trasformati in punti T, in modo che siano più leggibili ed interpretabili.
Nella scala T ideata da McCall, si ha una media di 50 e una deviazione standard di 10, quindi per calcolare i punti t si fa: T=50+z*10.
Un'altra scala molto usata è la stanine, che va da 1 a 9: T=5+z*2.

QI di deviazione
La definizione tipica di QI è quella di QI=EM/EC*100, dove EM è l'età mentale del soggetto e EC è l'età cronologica.
Se l'età mentale corrisponde perfettamente all'età cronologica allora il QI è uguale a 100, e si è nella norma.
Questo metodo di calcolo ha dei limiti tecnici, se rispetto ad ogni fascia di età i QI hanno una propria distribuzione e una propria variabilità (DS), i QI non sono però più confrontabili tra soggetti di età diversa.
Si è quindi creato il QI di deviazione, che è una forma di punto standard in una scala di misure normalizzate caratterizzata da una media di 100 e da una DS di circa 15.
I QI sono quindi confrontabili tra di loro se i test che li adottano attribuiscono lo stesso valore alla DS.

Confronto tra scale diverse
I diversi tipi di scale normalizzate permettono di ottenere valori che prescindono dall'unità di misura usata in un test, rendendo possibile il confronto tra prestazioni dello stesso individuo in test diversi e tra individui diversi sullo stesso test.
Per assemblare i punteggi di test diversi si usa esprimerli in un indice unico.
Una batteria di test corrisponde ad un insieme di test differenziati per i contenuti ma concorrenti alla previsione di un singolo criterio complesso.
I procedimenti usati per creare l'indice unico sono:

Punteggi discriminanti multipli: si stabilisce un punteggio minimo discriminante per ciascun test inserito nella batteria, e non vengono presi in considerazione tutti i soggetti che hanno valori inferiori a questo punteggio.
Questo metodo consente di escludere i soggetti che non rispettano certi requisiti minimi, dove però la discriminazione multipla non consente differenziazioni tra i soggetti accettati o eliminati.
Somma dei punteggi z ponderati: lo psicologo può decidere che gli attributi da valutare contribuiscono in quantità diversa nel determinare una certa caratteristica, e quindi decide di attribuire pesi diversi ai test usati, con proporzioni diverse prestabilite.
Si trasformano quindi in punti z i punteggi dei soggetti nei vari test e si moltiplicano per i pesi loro assegnati, si sommano poi i risultati ottenuti per ottenere dei punti standard ponderati che si distribuiscono normalmente (quindi media 0 e DS=1).

Oggi è un altro post

lunedì 25 aprile 2016

Attendibilità e validità (2/4): L'interpretazione dei punteggi

<< Lezione precedente - Prossima lezione >>

Torna all'elenco delle lezioni