metodi e misurazioni statistiche perugia 17/18 dicembre 2012 damiano terenzi...
TRANSCRIPT
![Page 2: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/2.jpg)
2
INTRODUZIONE
Definizione di misura:
Assegnare valori numerici ad oggetti o eventi secondo regole che consentono di rappresentare le proprietà degli oggetti e degli eventi tramite le proprietà del sistema numerico
![Page 3: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/3.jpg)
3
INTRODUZIONE
• Molta parte del lavoro degli psicologi richiede di effettuare misurazioni (p.e. registrare i movimenti oculari o misurare la risposta galvanica cutanea di persone sotto stress)– sia in laboratorio sia sul campo.
• In ogni caso, l’operazione di misurazione produce dei numeri
Fondamentale a questo scopo è la STATISTICA= disciplina che si occupa della raccolta di dati numerici e della derivazione di inferenze di tali dati.
IL PROBLEMA DELLO PSICOLOGO È DI INTERPRETARLI!
![Page 4: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/4.jpg)
4
ROADMAP DEL CAPITOLO
STATISTICA DESCRITTIVA
INFERENZA STATISTICA
COEFFICIENTE DI CORRELAZIONE
![Page 5: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/5.jpg)
5
STATISTICA DESCRITTIVA
DISTRIBUZIONI DI FREQUENZA
MISURE DELLA
TENDENZA CENTRALE
MISURE DELLA
VARIABILITÀ
![Page 6: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/6.jpg)
6
STATISTICA DESCRITTIVA• Branca della statistica che studia i criteri di rilevazione, di classificazione e
di sintesi delle informazioni relative ad una popolazione oggetto di studio.
• Raccoglie le informazioni sulla popolazione, o su una parte di essa (campione), in distribuzioni, e le sintetizza descrittivamente attraverso famiglie di indici: valori medi, indici di variabilità, indici di forma, rapporti statistici, relazioni statistiche.
• I risultati ottenuti in tal modo si possono definire certi, a meno di errori di misurazione, che essendo dovuti al caso, in media, si annullano per definizione.
• Ha come obiettivo quello di organizzare, riassumere e presentare i dati in modo ordinato; i suoi strumenti permettono quindi di sintetizzare i dati. (http://it.wikipedia.org/wiki/Statistica_descrittiva)
![Page 7: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/7.jpg)
7
DISTRIBUZIONI DI FREQUENZA
• Supponiamo di voler studiare i punteggi degli esami di ammissione all’università di 5000 studenti. Questi punteggi sono i dati grezzi.
• Attraverso dei sunti statistici (p.e. calcolando la media di tutti i punteggi, oppure il punteggio min o max) possiamo ricordare più facilmente i dati e ragionarci sopra.
• Queste formulazioni che compendiano i dati costituiscono la cosiddetta statistica descrittiva.
![Page 8: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/8.jpg)
8
DISTRIBUZIONI DI FREQUENZA
• Una distribuzione di frequenza permette di raggruppare i valori dei dati grezzi e di renderli comprensibili.
• Per raggruppare i dati bisogna: 1. suddividere in intervalli i dati 2. contare il numero di item che cade in ogni intervallo L’intervallo in cui sono raggruppati i punteggi è chiamato
intervallo di classe. La decisione del numero di intervalli di classe in cui devono essere raggruppati i dati si basa sul giudizio dello sperimentatore
![Page 9: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/9.jpg)
9
INTERVALLI DI CLASSE
Intervalli di classe N. persone per classe
50-59 1
60-69 3
70-79 7
80-89 3
90-99 1
84 75 91
61 75 67
72 87 79
75 79 83
77 51 69
Intervalli di classe=10
Punteggi grezzi degli esami di ammissione di 15 studenti
![Page 10: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/10.jpg)
10
ISTOGRAMMA DI FREQUENZA
50-59 60-69 70-79 80-89 90-990
1
2
3
4
5
6
7
8
Istogramma di frequenza
L’istogramma di frequenza è una distribuzione di frequenza rappresentata graficamente.
BASI= intervalli di classe
ALTEZZE= frequenze di classe
![Page 11: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/11.jpg)
11
POLIGONO DI FREQUENZA
50-59 60-69 70-79 80-89 90-990
1
2
3
4
5
6
7
8Istogramma di frequenza
50-59 60-69 70-79 80-89 90-990
1
2
3
4
5
6
7
8
Poligono di frequenza
Il poligono di frequenza viene costruito segnando le frequenze delle classi al centro dell’intervallo di classe e segnando i punti ottenuti con linee rette
Il poligono di frequenza fornisce le stesse informazioni dell’istogramma di frequenza, ma per mezzo di una serie di linee collegate invece che rettangoli
![Page 12: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/12.jpg)
12
STATISTICA DESCRITTIVA
DISTRIBUZIONI DI FREQUENZA
MISURE DELLA
TENDENZA CENTRALE
MISURE DELLA
VARIABILITÀ
![Page 13: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/13.jpg)
13
MISURE DELLA TENDENZA CENTRALEPer misure della tendenza centrale si intende un punto rappresentativo sulla nostra scala, ovvero un punto centrale che sintetizza importanti informazioni sui dati.Si usano comunemente tre di tali misure:
1) La MEDIA aritmetica si ottiene si ottiene sommando i punteggi e dividendoli per il loro numero
2) La MEDIANA è il punteggio centrale, e si ottiene mettendo in ordine i punteggi e poi contando verso il centro a partire dalle due estremità. Se il numero di casi è pari, facciamo semplicemente la media dei due casi che si trovano vicino alla metà
3) La MODA è il punteggio più frequente in una data distribuzione
![Page 14: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/14.jpg)
14
MediaESEMPIO:
11, 20, 18, 20, 19, 18, 7, 10 (N=8)
8
107181920182011M 15,37
La MEDIA aritmetica si ottiene sommando i punteggi e dividendoli per il loro numero. Si indica con M per i campioni. Quando ci si riferisce alla popolazione si indica con la lettere .
![Page 15: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/15.jpg)
15
MEDIANA
La MEDIANA è il punteggio centrale, e si ottiene mettendo in ordine i punteggi e poi contando verso il centro a partire dalle due estremità. Se il numero di casi è pari, facciamo semplicemente la media dei due casi che si trovano vicino alla metà.
11 26 27 10 35 44 45 10 11 26 27 35 44 45
La mediana in questo caso è rappresentata dal valore che occupa la quarta posizione (27)
ESEMPIO:CASI DISPARI
CASI PARI
11 17 45 35 13 44 11 13 17 35 44 45
La mediana in questo caso è data dalla media dei due casi che si trovano vicino le estremità (17+35)/2=26
![Page 16: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/16.jpg)
16
MODAESEMPI:
11 26 27 10 26 44 45 26 11 26 27 26 44 45
Mo=26
La MODA è il punteggio più frequente in
una data distribuzione
10 26 44 10 22 44 45 8 11 26 44 9 45 45
Mo=44; 45
![Page 17: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/17.jpg)
17
MODA
UNIMODALE BIMODALE
Trimodale, Quadrimodale ecc…
![Page 18: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/18.jpg)
18
DISTRIBUZIONI SIMMETRICHE
Mo Me M
In una distribuzione simmetrica (o normale), nella quale i punteggi sono distribuiti in maniera uguale su entrambi i lati rispetto al centro, la media, la mediana e la moda coincidono
![Page 19: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/19.jpg)
19
SIMMETRICHE VS ASIMMETRICHE
![Page 20: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/20.jpg)
20
DISTRIBUZIONI ASIMMETRICHE
Supponiamo di voler analizzare gli orari di partenza di un treno del mattino. Il treno di solito parte in orario; qualche volta parte in ritardo, ma mai in anticipo. Per un treno il cui orario di partenza è alle 8.00, la registrazione di una settimana potrebbe essere la seguente:
ESEMPIO:
Lunedì 8.0
Martedì 8.04
Mercoledì 8.02
Giovedì 8.19
Venerdì 8.22
Sabato 8.00
Domenica 8.00
Media = 8.07
Mediana = 8.2
Moda = 8.00
La distribuzione degli orari di partenza, nel nostro esempio, è asimmetrica a causa delle partenze ritardate; esse innalzano la media dell’ora di partenza, ma non hanno molta influenza sulla mediana o la moda.
![Page 21: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/21.jpg)
21
DISTRIBUZIONE ASIMMETRICA POSITIVA
Media
![Page 22: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/22.jpg)
22
DISTRIBUZIONE ASIMMETRICA NEGATIVA
Media
Le distribuzioni asimmetriche sono caratterizzate generalmente dalla direzione delle code. Notate inoltre che media, mediana e moda, in una distribuzione asimmetrica non coincidono.
![Page 23: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/23.jpg)
23
STATISTICA DESCRITTIVA
DISTRIBUZIONI DI
FREQUENZAMISURE DELLA
TENDENZA CENTRALEMISURE DELLA VARIABILITÀ
![Page 24: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/24.jpg)
24
MISURE DELLA VARIABILITÀ 1. NON FORNISCONO ALCUNA
INFORMAZIONE SULLA DISTRIBUZIONE DEI DATI.
2. GLI STESSI INDICI DI TENDENZA CENTRALE POSSONO AVERE DISTRIBUZIONI ASSAI DIVERSE
Limiti
dei VALORI MEDI:
MISURE DI DISPERSIONE DI
PUNTEGGI DI UNA DISTRIBUZIONE ATTORNO ALLA
MEDIA
< Variabilità
> VariabilitàMedia + rappresentativa
Media - rappresentativa
=
=
{
![Page 25: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/25.jpg)
25
MISURE DELLA VARIABILITÀGLI STESSI INDICI DI TENDENZA CENTRALE (IN QUESTO CASO LA MEDIA)
POSSONO AVERE DISTRIBUZIONI ASSAI DIVERSE
![Page 26: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/26.jpg)
26
CAMPO DI VARIAZIONE
Campo Variazione = x max – x min
•È il più semplice degli indici di variazione
•Si calcola facendo la differenza tra il dato più grande e il dato più piccolo:
ESEMPIO:
Punteggi degli studenti della classe 1:73, 74, 75, 76, 77 (media = 75) CV (77-73) = 4
Punteggi degli studenti della classe 2:60, 65, 75, 85, 90 (media = 75) CV (90-60) = 30
![Page 27: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/27.jpg)
27
Misura il grado di distanza dei
punteggi di una distribuzione dalla
media della distribuzione stessa.
VARIANZA
Per calcolarla bisogna:1) Sottrarre i singoli punteggi dalla media della distribuzione così da ottenere la deviazione d di ogni punteggio dalla media.
2) Elevare al quadrato ogni deviazione per eliminare i punteggi negativi
3)Sommare tutte le deviazioni quadrate e dividere la sommatoria per il loro numero, in modo da ottenere la deviazione media = varianza
![Page 28: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/28.jpg)
28
VARIANZAESEMPIO:
Punteggi degli studenti della classe 1:73, 74, 75, 76, 77 (media = 75)
1) Sottrarre i singoli punteggi dalla media della distribuzione così da ottenere la deviazione d di ogni punteggio dalla media.
2) Elevare al quadrato ogni deviazione per eliminare i punteggi negativi
(73-75) , (74-75) , (75-75) , (76-75) , (77-75) d = 4, 1, 0, 1, 4 3) Sommare tutte le deviazioni quadrate e dividere la sommatoria per il loro numero, in modo
da ottenere la deviazione media = varianza
2 2 2 22
25
41014
2
![Page 29: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/29.jpg)
29
Deviazione StandardLimite
de
lla
Varia
nza:
LA VARIANZA È ESPRESSA IN UNITÀ DI MISURA AL QUADRATO!
Si può invece ottenere una misura della variabilità espressa nelle unità di misura originarie (nel nostro caso, voti in un esame) semplicemente estraendo la radice quadrata dalla varianza. Questo indice è noto come DEVIAZIONE STANDARD
… e quindi, in riferimento all’esempio precedente:
4.12
5
41014
*
![Page 30: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/30.jpg)
30
INFERENZA STATISTICAPOPOLAZIONI E CAMPIONI
DISTRIBUZIONE NORMALE
QUANTO È RAPPRESENTATIVA LA MEDIA?
SIGNIFICATIVITÀ DI UNA DIFFERENZA
![Page 31: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/31.jpg)
31
POPOLAZIONI e CAMPIONI
STUDIO DEL CAMPIONE
TECNICHE STATISTICHE
INFORMAZIONI SULLA POPOLAZIONE
ETÀ
Età
CAMPIONEPOPOLAZIONE
Inferenze Statistiche
Errore campionatura
POPOLAZIONE ≠ CAMPIONE
![Page 32: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/32.jpg)
32
POPOLAZIONI e CAMPIONI
• L’inferenza statistica riguarda il problema di trarre inferenze o giudizi su una caratteristica di una popolazione basandosi su informazioni ottenute da un campione di quella popolazione.
• Se i test statistici indicano che l’entità dell’effetto riscontrato nel campione è abbastanza grande (in rapporto alla stima dell’errore di campionatura), allora possiamo ritenere che l’effetto riscontrato nel campione vale per la popolazione in generale.
![Page 33: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/33.jpg)
33
DISTRIBUZIONE NORMALE
• La curva normale o curva di Gauss è una distribuzione teorica (rappresentazione matematica di una distribuzione ideale) di punteggi in una popolazione.
• L’importanza di questa distribuzione è dovuta al fatto che molti dei fenomeni osservati si distribuiscono normalmente o con forme che si approssimano alla curva normale.
• Gran parte della statistica inferenziale si basa sulle proprietà di questa distribuzione.
![Page 34: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/34.jpg)
34
DISTRIBUZIONE NORMALE
50-59 60-69 70-79 80-89 90-990
1
2
3
4
5
6
7
8Istogramma di frequenza
(Vedi esempio slide 9)
Intervalli di classe N. persone per classe
50-59 1
60-69 3
70-79 7
80-89 3
90-99 1
Esempio di distribuzione normale
![Page 35: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/35.jpg)
35
DISTRIBUZIONE NORMALE
Y
x
CURVA DI GAUSS
La > parte degli item cade vicino alla media (punto più alto).
La campana si appiattisce in corrispondenza dei punteggi molto alti o molto bassi.
![Page 36: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/36.jpg)
36
DISTRIBUZIONE NORMALE
2
2
1
2
1
x
exfY
Equazione della distribuzione normale:
dove: =media della popolazione =d.s. della popolazione =costante (=3.14) e=costante (=2.718)
Si sostituisce nella formula il valore di x che ci interessa (ad esempio l’altezza o il punteggio ad un test di intelligenza) e troviamo la y, cioè la probabilità di ottenere quel valore in una distribuzione con una data media e ds.
![Page 37: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/37.jpg)
37
DISTRIBUZIONE NORMALE
1. UNIMODALE (Moda=Media=Mediana)
2. INFINITA: va da - a +
3. SIMMETRICA rispetto alla Y massima (f(x))
4. ASINTOTICA: si avvicina all’asse delle X senza mai toccarlo
5. È descritta da due soli parametri: media e deviazione standard.
![Page 38: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/38.jpg)
38
DISTRIBUZIONE NORMALE
Y
(valori di X) X
L’area sottesa dall’intera curva è pari a 1, e rappresenta l’intera popolazione.Dato che la curva è simmetrica, l’area compresa tra - e è uguale a .50 come quella compresa tra e +.
.50 .50
(frequenze f(x) di ciascun valore)
- ∞ + ∞
![Page 39: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/39.jpg)
39
DISTRIBUZIONE NORMALE
+1= 0,341=34.1% della distribuzione +2= 0,477=47.7% della distribuzione +3= 0,498=49.8% della distribuzione
Deviazione Standard
Num
ero
dei C
asi
Probabilità che hanno gli item appartenenti ad una popolazione normalmente distribuita di scostarsi dalla media, per ogni valore prestabilito.
COSTANTI
=
![Page 40: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/40.jpg)
40
PUNTEGGI STANDARD
• Dev. Standard = misura della variabilità che consente di interpretare la distanza dalla media.
• Punteggio Standard = punteggio basato su un multiplo della dev. standard
![Page 41: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/41.jpg)
41
PUNTEGGI STANDARDESEMPIO:Qual è il punteggio standard di uno studente che all’esame ha ottenuto 90 assumendo che la media della popolazione è di 70 e la deviazione standard di 10?
0.210
7090
ESERCIZIO:Qual è il punteggio standard di uno studente che all’esame ha ottenuto 53 assumendo che la media della popolazione è di 75 e la deviazione standard di 10?
Il segno del punteggio standard (+ o -) indica se il punteggio si colloca sopra o sotto la media, mentre il valore indica di quanto quel punteggio si discosta dalla m, in termini di dev.standard.
![Page 42: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/42.jpg)
42
QUANTO È RAPPRESENTATIVA LA MEDIA?
In che misura la media del campione è un predittore
attendibile della media della popolazione?
MediaReale
Diversi campioni casuali tratti dalla stessa
popolazione hanno medie differenti, dando così
luogo ad una distribuzione di medie campionarie
intorno alla media reale della popolazione.
![Page 43: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/43.jpg)
43
QUANTO È RAPPRESENTATIVA LA MEDIA?
Le media campionarie sono dei valori numerici per i quali si può calcolare la deviazione standard. Questa deviazione standard viene chiamata errore standard della media (ES) e possiamo stimarla tramite la seguente formula:
σ = dev.standard del campionen = numero dei casi da cui è stata calcolata la media di ogni campione
![Page 44: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/44.jpg)
44
QUANTO È RAPPRESENTATIVA LA MEDIA?
In base alla formula, all’aumentare del n dei campioni diminuisce l’ES (e viceversa):
Il calcolo dell’errore standard della media ci consente di fare delle affermazioni precise circa il grado di incertezza nel nostro calcolo della media. Più numerosi sono i casi nel campione più si riduce l’incertezza. Perciò una media basata su un campione numeroso è più attendibile (ha più probabilità di essere vicina alla media reale della popolazione) di una media basata su un campione più piccolo.
> n < ES < n > ES
![Page 45: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/45.jpg)
45
SIGNIFICATIVITÀ DI UNA DIFFERENZA
• La differenza tra due medie campionarie è significativa (cioè riflette una reale differenza) oppure è semplicemente il risultato di un errore di campionatura?
• La significatività di una differenza dipende da:1) entità della differenza calcolata
2) variabilità della distribuzione delle M messe a confronto
MD
σ D M
RAPPORTO CRITICO
Differenza fra le medie
ES della differenza fra le medie==
![Page 46: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/46.jpg)
46
SIGNIFICATIVITÀ DI UNA DIFFERENZA
Destrorsi- forza in kg della stretta di mano
Mancini- forza in kg della stretta di mano
Destrorsi- forza in kg della stretta di mano
Mancini- forza in kg della stretta di mano
La tabella riporta due esempi che confrontano la differenza tra le medie. La differenza tra le medie è sempre la stessa (8kg) sia a sinistra che a destra della tabella. Tuttavia, i dati della parte di destra indicano una differenza tra le medie più attendibile rispetto ai dati della parte di sinistra.
![Page 47: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/47.jpg)
47
SIGNIFICATIVITÀ DI UNA DIFFERENZA
σ MD
)()( MM 2 2
ESEMPIO:Supponiamo di voler confrontare i punteggi in un test di profitto nella lettura di bambini e bambine statunitensi di prima elementare. Una volta identificato un campione casuale sottoponiamo i bambini e le bambine ad un test. Supponiamo che il punteggio medio per i maschi fosse 70 con errore standard di 0.40, mentre il punteggio medio delle femmine di 72 con errore standard di 0,30. I dati campionari suggeriscono che
I II
![Page 48: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/48.jpg)
48
SIGNIFICATIVITÀ DI UNA DIFFERENZA
le femmine ottengono punteggi migliori dei maschi; tuttavia, possiamo inferire che le cose starebbero così anche se avessimo esaminato tutti i bambini e le bambine degli Stati uniti? IL RAPPORTO CRITICO CI AIUTA A PRENDERE QUESTA DECISIONE.
25.009.016.0 5.0
Rapporto critico = 0.4
5.0
7072
La differenza fra le medie osservate è statisticamente significativa dato che il rapporto critico in questo caso è superiore a 2.
![Page 49: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/49.jpg)
49
SIGNIFICATIVITÀ DI UNA DIFFERENZA
• Una proprietà matematica della distribuzione normale è che il 95% dei valori è compreso tra la media +/- 1,96 deviazioni standard (approssimativamente +/-2 dev.st).
• Perciò, affinché la differenza tra le medie possa essere considerata significativa un rapporto critico dovrebbe avere un valore uguale o maggiore a 2.0 (possiamo trattare il rapp. critico come un punteggio standard dato che è semplicemente la differenza tra due medie, espressa come multiplo del suo errore standard).
![Page 50: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/50.jpg)
50
SIGNIFICATIVITÀ DI UNA DIFFERENZA
P≤ 0.05 (Rapporto critico maggiore o uguale a 2)
Significatività:
2,5% (P=0,025)
2,5% (P=0,025)
Per condurre un test statistico è importante fissare il livello di significatività; In psicologia solitamente (si tratta di una regola arbitraria!) una serie di dati viene detta statisticamente significativa se il suo valore p (p = probabilità) è minore o uguale a 0,05 (ovvero il 5%).
![Page 51: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/51.jpg)
51
SIGNIFICATIVITÀ DI UNA DIFFERENZA
Il livello di significatività 5% viene adottato frequentemente in quanto si ritiene che il rapporto 1/20 (cioè 0.05) sia sufficientemente piccolo da poter concludere che sia «piuttosto improbabile» che la differenza osservata possa esser dovuta al semplice caso. In effetti, la differenza potrebbe essere dovuta al caso, ma lo sarà 1 volta su 20.Non è sempre necessario usare il livello 5%; in alcuni esperimenti può essere appropriato un livello maggiore di significatività (ad esempio un livello di significatività dell’1%).
![Page 52: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/52.jpg)
52
COEFFICIENTE DI CORRELAZIONE• CORRELAZIONE = variazione concomitante di coppie
di misure.• COEFFICIENTE DI CORRELAZIONE = permette di
stabilire il grado di relazione.
Esempi: Autostima e AutoefficaciaAnsia e DepressioneEtà e Peso
![Page 53: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/53.jpg)
53
COEFFICIENTE DI CORRELAZIONE
Metodo prodotto-momento : Metodo più frequentemente utilizzato per calcolare il
coefficiente di correlazione. Produce un indice che viene convenzionalmente indicato
con la lettera r. Consente di fare previsioni, verificare teorie, verificare
l’attendibilità dei test.
![Page 54: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/54.jpg)
54
COEFFICIENTE DI CORRELAZIONE
Formula per calcolare il coefficiente di correlazione prodotto momento:
N
dydxr
))((
x y
Dove:
x = misura 1y = misura 2dx; dy = scarti di ogni punteggio dalla sua mediaN = numero delle misurazioni abbinateσ ; σ = deviazioni standard delle distribuzioni dei punteggi x e yx y
![Page 55: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/55.jpg)
55
COEFFICIENTE DI CORRELAZIONEESEMPIO:
Adam 71 39 6 9 54
Bill 67 27 2 -3 -6
Charles 65 33 0 3 0
David 63 30 -2 0 0
Edward 59 21 -6 -9 54
SOMMA 325 150 0 0 102
MEDIA 65 30
Studente punt.x punt.y (dx) (dy) (dx)(dy)
Qual è la correlazione tra i punteggi x (test di ammissione) e i punteggi y( voti del primo anno di università)?
N
dydxr
))((
x y
46
x
y
85,06.4.5
102
![Page 56: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/56.jpg)
56
COEFFICIENTE DI CORRELAZIONE
IL COEFFICIENTE DI CORRELAZIONE PRODOTTO MOMENTO VARIA TRA:
-1<= r <= +1
r = +1 correlazione massima positiva (perfetta)r= 0 correlazione assente r = -1 correlazione massima negativar > 0 correlazione presente : all’aumentare di x aumenta yr < 0 correlazione presente : all’aumentare di x diminuisce y
![Page 57: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/57.jpg)
57
COEFFICIENTE DI CORRELAZIONE
La correlazione misura l’addensamento/dispersione intorno alla retta (linearità nella covarianza) . Ogni punto rappresenta i punteggi x e y.
punteggi x
punt
eggi
y
ADDENSAMENTO DISPERSIONE
![Page 58: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/58.jpg)
58
0
0,1
0,2
0,3
0,4
0,5
0,6
0 10 20 30 40 50 60
Eta (anni)
Vel
ocità
di r
eazi
one
COEFFICIENTE DI CORRELAZIONEDirezione della relazione
0
0,2
0,4
0,6
0,8
1
1,2
0 10 20 30 40 50 60
Eta
Cap
acit
à r
ich
iam
o
Povertà
Aspe
ttati
va d
i vita
Punteggio test d’ingresso
Voto
di l
aure
a Correlazione positiva: r>0
Correlazionenegativa: r<0
all’aumentare di x aumenta y
all’aumentare di x diminuisce y
![Page 59: METODI E MISURAZIONI STATISTICHE Perugia 17/18 Dicembre 2012 Damiano Terenzi damianoterenzi@gmail.com 1](https://reader036.vdocumenti.com/reader036/viewer/2022070313/5542eb6a497959361e8d609c/html5/thumbnails/59.jpg)
59
COEFFICIENTE DI CORRELAZIONE
• Nota Bene: r non implica un rapporto di causa-effetto!• Quando due gruppi di punteggi correlano fra loro
possiamo sospettare che abbiano in comune alcuni fattori causali ma non possiamo concludere che uno di essi sia causa dell’altro.
• Bisogna perciò evitare di dare un’interpretazione causale al coefficiente di correlazione. È tuttavia possibile che quando due variabili sono correlate, una possa essere la causa dell’altra.