Introduzione
Il coefficiente di correlazione prodotto-momento di Pearson (la correlazione di Pearson, in breve) è una misura della forza e della direzione dell’associazione che esiste tra due variabili misurate su almeno una scala di intervalli.
Ad esempio, è possibile utilizzare la correlazione di Pearson per capire se esiste un’associazione tra le prestazioni dell’esame e il tempo impiegato per la revisione., Potresti anche usare una correlazione di Pearson per capire se esiste un’associazione tra depressione e durata della disoccupazione.
La correlazione di Pearson tenta di tracciare una linea di migliore adattamento attraverso i dati di due variabili, e il coefficiente di correlazione di Pearson, r, indica quanto lontano tutti questi punti dati sono da questa linea di migliore adattamento (cioè, quanto bene i punti dati si adattano a questo modello / linea di migliore adattamento). Puoi saperne di più nella nostra guida più generale sulla correlazione di Pearson, che ti consigliamo se non hai familiarità con questo test.,
Nota: Se una delle tue due variabili è dicotomica puoi usare invece una correlazione punto-biseriale, o se hai una o più variabili di controllo, puoi eseguire una correlazione parziale di Pearson.
Questa guida “quick start” mostra come eseguire una correlazione di Pearson utilizzando le statistiche SPSS, oltre a interpretare e riportare i risultati di questo test. Tuttavia, prima di presentarti questa procedura, devi comprendere le diverse ipotesi che i tuoi dati devono soddisfare affinché la correlazione di Pearson ti dia un risultato valido., Discutiamo queste ipotesi dopo.
Statistiche SPSS
Ipotesi
Quando si sceglie di analizzare i dati utilizzando la correlazione di Pearson, parte del processo comporta il controllo per assicurarsi che i dati che si desidera analizzare possano effettivamente essere analizzati utilizzando la correlazione di Pearson. È necessario farlo perché è opportuno utilizzare la correlazione di Pearson solo se i dati “passano” quattro ipotesi richieste per la correlazione di Pearson per fornire un risultato valido., In pratica, il controllo di queste quattro ipotesi aggiunge solo un po ‘più di tempo alla tua analisi, richiedendo di fare clic su alcuni altri pulsanti nelle statistiche SPSS quando esegui l’analisi, oltre a pensare un po’ di più ai tuoi dati, ma non è un compito difficile.
Prima di presentarvi queste quattro ipotesi, non stupitevi se, durante l’analisi dei vostri dati utilizzando le statistiche SPSS, una o più di queste ipotesi viene violata (cioè, non è soddisfatta)., Questo non è raro quando si lavora con dati del mondo reale piuttosto che con esempi di libri di testo, che spesso mostrano solo come eseguire la correlazione di Pearson quando tutto va bene! Tuttavia, non preoccuparti. Anche quando i tuoi dati falliscono determinate ipotesi, c’è spesso una soluzione per superare questo. Per prima cosa, diamo un’occhiata a queste quattro ipotesi:
- Ipotesi #1: le tue due variabili dovrebbero essere misurate a livello di intervallo o rapporto (cioè, sono continue)., Esempi di variabili che soddisfano questo criterio includono il tempo di revisione (misurato in ore), l’intelligenza (misurata utilizzando il punteggio IQ), le prestazioni dell’esame (misurate da 0 a 100), il peso (misurato in kg) e così via. Puoi saperne di più sulle variabili di intervallo e rapporto nella nostra guida ai tipi di variabili.
- Ipotesi # 2: esiste una relazione lineare tra le due variabili., Mentre ci sono un certo numero di modi per verificare se esiste una relazione lineare tra le due variabili, suggeriamo di creare un grafico a dispersione utilizzando le statistiche SPSS, in cui è possibile tracciare una variabile contro l’altra variabile e quindi ispezionare visivamente il grafico a dispersione per verificare la linearità., Il tuo scatterplot potrebbe essere simile a uno dei seguenti:
Se la relazione visualizzata nel tuo scatterplot non è lineare, dovrai eseguire un equivalente non parametrico alla correlazione di Pearson o trasformare i tuoi dati, cosa che puoi fare usando le statistiche SPSS., Nelle nostre guide avanzate, ti mostriamo come: (a) creare un grafico a dispersione per verificare la linearità quando si esegue la correlazione di Pearson usando le statistiche SPSS; (b) interpretare diversi risultati del grafico a dispersione; e (c) trasformare i tuoi dati usando le statistiche SPSS se non esiste una relazione lineare tra le tue due variabili.
Nota: la correlazione di Pearson determina il grado in cui una relazione è lineare. In altre parole, determina se esiste una componente lineare di associazione tra due variabili continue. In quanto tale, la linearità non è in realtà un’ipotesi della correlazione di Pearson., Tuttavia, normalmente non si desidera perseguire la correlazione di Pearson per determinare la forza e la direzione di una relazione lineare quando si conosce già la relazione tra le due variabili non è lineare. Invece, la relazione tra le due variabili potrebbe essere meglio descritta da un’altra misura statistica. Per questo motivo, non è raro visualizzare la relazione tra le due variabili in un grafico a dispersione per vedere se l’esecuzione della correlazione di Pearson è la scelta migliore come misura di associazione o se un’altra misura sarebbe migliore.,
- Ipotesi #3: non ci dovrebbero essere valori anomali significativi. I valori anomali sono semplicemente singoli punti dati all’interno dei tuoi dati che non seguono il solito schema (ad esempio, in uno studio sui punteggi IQ di 100 studenti, dove il punteggio medio era 108 con solo una piccola variazione tra gli studenti, uno studente aveva un punteggio di 156, che è molto insolito, e potrebbe persino collocarla nel top 1% dei punteggi IQ a livello globale)., I seguenti scatterplots evidenziano il potenziale impatto dei valori anomali:
Il coefficiente di correlazione di Pearson, r, è sensibile ai valori anomali, che possono avere un effetto molto grande sulla linea di best fit e sul coefficiente di correlazione di Pearson. Pertanto, in alcuni casi, includere valori anomali nell’analisi può portare a risultati fuorvianti. Pertanto, è meglio se non ci sono valori anomali o sono ridotti al minimo., Fortunatamente, quando si utilizzano le statistiche SPSS per eseguire la correlazione di Pearson sui dati, è possibile includere facilmente le procedure per la ricerca di valori anomali. Nella nostra guida alla correlazione avanzata di Pearson, noi: (a) mostriamo come rilevare valori anomali usando un grafico a dispersione, che è un processo semplice quando si usano le statistiche SPSS; e (b) discutiamo alcune delle opzioni disponibili per gestire valori anomali.
- Ipotesi # 4: le tue variabili dovrebbero essere distribuite approssimativamente normalmente., Per valutare la significatività statistica della correlazione di Pearson, è necessario avere normalità bivariata, ma questa ipotesi è difficile da valutare, quindi un metodo più semplice è più comunemente usato. Questo metodo più semplice comporta la determinazione della normalità di ciascuna variabile separatamente. Per verificare la normalità è possibile utilizzare il test Shapiro-Wilk di normalità, che è facilmente testato per l’utilizzo di statistiche SPSS. Oltre a mostrarti come farlo nella nostra guida alla correlazione di Pearson avanzata, spieghiamo anche cosa puoi fare se i tuoi dati falliscono questa ipotesi.,
È possibile controllare le ipotesi #2, #3 e #4 utilizzando le statistiche SPSS. Ricorda che se non si testano correttamente queste ipotesi, i risultati ottenuti durante l’esecuzione della correlazione di Pearson potrebbero non essere validi. Questo è il motivo per cui dedichiamo una serie di sezioni della nostra guida di correlazione di Pearson avanzata per aiutarti a ottenere questo diritto. Puoi scoprire i nostri contenuti avanzati sulla nostra pagina Panoramica delle funzionalità o, più specificamente, imparare come aiutiamo a testare le ipotesi sulla nostra pagina delle funzionalità: ipotesi.,
Nella sezione, Procedura di test in SPSS Statistics, illustriamo la procedura SPSS Statistics per eseguire una correlazione di Pearson supponendo che nessuna ipotesi sia stata violata. In primo luogo, abbiamo esposto l’esempio che usiamo per spiegare la procedura di correlazione di Pearson nelle statistiche SPSS.