Introducere
Pearson product-moment correlation coefficient (corelație Pearson, pentru scurt) este o măsură de puterea și direcția de asociere care există între două variabile măsurate pe cel puțin un interval de scară.de exemplu, puteți utiliza o corelație Pearson pentru a înțelege dacă există o asociere între performanța examenului și timpul petrecut în revizuire., Ai putea folosi, de asemenea, o corelație Pearson pentru a înțelege dacă există o asociere între depresie și durata șomajului.o corelație Pearson încearcă să traseze o linie de cea mai bună potrivire prin datele a două variabile, iar coeficientul de corelație Pearson, r, indică cât de departe sunt toate aceste puncte de date de această linie de cea mai bună potrivire (adică, cât de bine punctele de date se potrivesc acestui model/linie de cea mai bună potrivire). Puteți afla mai multe în ghidul nostru mai general despre corelația lui Pearson, pe care îl recomandăm dacă nu sunteți familiarizat cu acest test.,
Notă: Dacă unul dintre cele două variabile este dihotomică puteți utiliza un punct-biserial de corelație în loc, sau dacă aveți una sau mai multe variabile de control, puteți rula o Pearson corelație parțială.acest ghid „pornire rapidă” vă arată cum să efectuați o corelație a lui Pearson folosind statisticile SPSS, precum și să interpretați și să raportați rezultatele acestui test. Cu toate acestea, înainte de a vă prezenta această procedură, trebuie să înțelegeți diferitele ipoteze pe care datele dvs. trebuie să le îndeplinească pentru ca corelația lui Pearson să vă ofere un rezultat valid., Vom discuta aceste ipoteze în continuare.
statistici SPSS
ipoteze
când alegeți să analizați datele utilizând corelația lui Pearson, o parte a procesului implică verificarea pentru a vă asigura că datele pe care doriți să le analizați pot fi de fapt analizate folosind corelația lui Pearson. Trebuie să faceți acest lucru deoarece este adecvat să utilizați corelația lui Pearson numai dacă datele dvs. „trec” patru ipoteze care sunt necesare pentru corelația lui Pearson pentru a vă oferi un rezultat valid., În practică, verificarea acestor patru ipoteze adaugă doar un pic mai mult timp analizei dvs., necesitând să faceți clic pe mai multe butoane din statisticile SPSS atunci când efectuați analiza, precum și să vă gândiți puțin mai mult la datele dvs., dar nu este o sarcină dificilă.înainte de a vă prezenta aceste patru ipoteze, nu vă mirați dacă, atunci când analizați propriile date folosind statistici SPSS, una sau mai multe dintre aceste ipoteze sunt încălcate (adică nu sunt îndeplinite)., Acest lucru nu este neobișnuit atunci când lucrați cu date din lumea reală, mai degrabă decât Exemple de manuale, care adesea vă arată doar cum să efectuați corelația lui Pearson atunci când totul merge bine! Cu toate acestea, nu vă faceți griji. Chiar și atunci când datele dvs. nu reușesc anumite ipoteze, există adesea o soluție pentru a depăși acest lucru. În primul rând, să aruncăm o privire la aceste patru ipoteze:
- ipoteza #1: cele două variabile trebuie măsurate la nivelul intervalului sau raportului (adică sunt continue)., Exemple de variabile care îndeplinesc acest criteriu includ timpul de revizuire (măsurat în ore), inteligența (măsurată folosind scorul IQ), performanța examenului (măsurată de la 0 la 100), greutatea (măsurată în kg) și așa mai departe. Puteți afla mai multe despre Variabilele intervalului și raportului în ghidul nostru tipuri de variabile.
- ipoteza #2: Există o relație liniară între cele două variabile., În timp ce există o serie de moduri de a verifica dacă există o relație liniară între cele două variabile, vă sugerăm să creați un scatterplot folosind statisticile SPSS, unde puteți trasa o variabilă împotriva celeilalte variabile și apoi inspectați vizual scatterplot pentru a verifica liniaritatea., Ta scatterplot poate arata ceva de genul una dintre următoarele:
Dacă relația afișate în scatterplot nu este liniară, va trebui să fie executați un echivalentul neparametric de corelație Pearson sau transforma datele, pe care le puteți face cu ajutorul programului SPSS Statistics., În ghidurile noastre îmbunătățite, vă arătăm cum să: (a) creați un scatterplot pentru a verifica liniaritatea atunci când efectuați corelația lui Pearson folosind statisticile SPSS; (b) interpretați diferite rezultate scatterplot; și (c) transformați datele utilizând statisticile SPSS dacă nu există o relație liniară între cele două variabile.notă: corelația lui Pearson determină gradul în care o relație este liniară. Într-un alt mod, determină dacă există o componentă liniară de asociere între două variabile continue. Ca atare, liniaritatea nu este de fapt o presupunere a corelației lui Pearson., Cu toate acestea, în mod normal, nu doriți să urmăriți corelația lui Pearson pentru a determina puterea și direcția unei relații liniare atunci când știți deja că relația dintre cele două variabile nu este liniară. În schimb, relația dintre cele două variabile ar putea fi mai bine descrisă de o altă măsură statistică. Din acest motiv, nu este neobișnuit să vizualizați relația dintre cele două variabile într-un scatterplot pentru a vedea dacă rularea unei corelații Pearson este cea mai bună alegere ca măsură de asociere sau dacă o altă măsură ar fi mai bună.,
- ipoteza # 3: nu ar trebui să existe valori superioare semnificative. Aberante sunt pur și simplu unic de puncte de date în date care nu respectă modelul obișnuit (de exemplu, într-un studiu de 100 de studenți scorurile IQ, în cazul în care scorul mediu a fost de 108, cu doar o mică variație între elevi, un elev a avut un scor de 156, ceea ce este foarte neobișnuit, și poate chiar a pus-o în top 1% din scoruri IQ la nivel global)., Următoarele scatterplots evidenția impactul potențial al aberante:
Pearson coeficientul de corelație, r, este sensibilă la valorile aberante, care pot avea un foarte mare efect pe linia cea mai potrivită și coeficientul de corelație Pearson. Prin urmare, în unele cazuri, includerea valorilor aberante în analiza dvs. poate duce la rezultate înșelătoare. Prin urmare, cel mai bine este dacă nu există valori exterioare sau sunt menținute la minimum., Din fericire, atunci când utilizați statisticile SPSS pentru a rula corelația Pearson pe datele dvs., puteți include cu ușurință proceduri pentru a verifica valorile aberante. În ghidul nostru de corelare îmbunătățit Pearson, noi: (a) vă arătăm cum să detectați valorile aberante folosind un scatterplot, care este un proces simplu atunci când utilizați statisticile SPSS; și (b) discutați unele dintre opțiunile disponibile pentru dvs. pentru a face față valorilor aberante.
- ipoteza #4: variabilele dvs. ar trebui să fie distribuite aproximativ în mod normal., Pentru a evalua semnificația statistică a corelației Pearson, trebuie să aveți normalitate bivariată, dar această ipoteză este dificil de evaluat, deci o metodă mai simplă este mai frecvent utilizată. Această metodă mai simplă implică determinarea normalității fiecărei variabile separat. Pentru a testa normalitatea, puteți utiliza testul Shapiro-Wilk al normalității, care este ușor de testat pentru utilizarea statisticilor SPSS. Pe lângă faptul că vă arătăm cum să faceți acest lucru în ghidul nostru de corelare îmbunătățit Pearson, vă explicăm și ce puteți face dacă datele dvs. nu reușesc această presupunere.,
puteți verifica ipotezele # 2, #3 și #4 folosind statisticile SPSS. Amintiți-vă că, dacă nu testați corect aceste ipoteze, rezultatele pe care le obțineți atunci când executați o corelație a lui Pearson ar putea să nu fie valide. Acesta este motivul pentru care dedicăm o serie de secțiuni ale ghidului nostru de corelare îmbunătățit Pearson pentru a vă ajuta să obțineți acest drept. Puteți afla despre conținutul nostru îmbunătățit pe pagina Caracteristici: Prezentare generală sau, mai precis, aflați cum vă ajutăm cu testarea ipotezelor pe pagina Caracteristici: ipoteze.,
în secțiunea, procedura de testare în statisticile SPSS, ilustrăm procedura de Statistică SPSS pentru a efectua o corelație Pearson presupunând că nu au fost încălcate ipoteze. În primul rând, am prezentat exemplul pe care îl folosim pentru a explica procedura de corelare a lui Pearson în statisticile SPSS.