Innledning
Pearson produkt-moment korrelasjon koeffisient (pearsons korrelasjon, for kort) er et mål på styrken og retningen av association som eksisterer mellom to variabler som måles på minst et intervall skala.
For eksempel, du kan bruke en pearsons korrelasjon for å forstå om det er en sammenheng mellom eksamen ytelse og tid tilbrakt med å revidere., Du kan også bruke en pearsons korrelasjon for å forstå om det er en sammenheng mellom depresjon og lengde av arbeidsledighet.
En pearsons korrelasjon forsøk på å tegne en linje som passer best gjennom data av to variabler, og Pearson korrelasjonskoeffisient, r, som viser hvor langt unna alle disse punkter er fra denne linjen som passer best (dvs., hvor godt data poeng passer denne modellen/line of best fit (best tilpasning). Du kan lese mer i vår mer generell veiledning på pearsons korrelasjon, som vi anbefaler hvis du ikke er kjent med denne testen.,
Merk: Hvis ett av de to variablene er dichotomous du kan bruke et punkt-biserial korrelasjon i stedet, eller hvis du har ett eller flere kontroll-variablene, kan du kjøre en pearsons delvis sammenheng.
Denne «rask start» guide viser deg hvordan du skal gjennomføre en pearsons korrelasjon ved hjelp av SPSS Statistikk, samt tolke og rapportere resultatene fra denne testen. Men før vi introdusere deg til denne prosedyren, må du forstå ulike forutsetninger for at dataene må møte for en pearsons korrelasjon for å gi deg et gyldig resultat., Vi drøfte disse forutsetningene neste.
SPSS Statistikk
Forutsetninger
Når du velger å analysere dine data ved hjelp av pearsons korrelasjon, en del av prosessen omfatter kontroll for å sikre at dataene du vil analysere faktisk kan bli analysert ved hjelp av pearsons korrelasjon. Du må gjøre dette fordi det er bare aktuelt å bruke pearsons korrelasjon hvis dataene «passerer» fire forutsetninger som er nødvendige for pearsons korrelasjon for å gi deg et gyldig resultat., I praksis kontrollere for disse fire forutsetningene legger bare litt mer tid til analyse, som krever at du klikker på noen flere knapper i SPSS Statistikk når du utfører din analyse, samt tenke litt mer om dine data, men det er ikke en vanskelig oppgave.
Før vi introdusere deg til disse fire forutsetningene, ikke bli overrasket om, når og analysere egne data ved hjelp av SPSS Statistikk, ett eller flere av disse forutsetningene er brutt (dvs., er ikke oppfylt)., Dette er ikke uvanlig når du arbeider med reelle data snarere enn lærebok eksempler, som ofte bare vise deg hvordan du skal gjennomføre pearsons korrelasjon når alt går bra! Likevel, ikke bekymre deg. Selv når data mislykkes visse forutsetninger, er det ofte en løsning for å overvinne dette. Først, la oss ta en titt på disse fire forutsetninger:
- Forutsetning #1: du har to variabler bør være målt på intervall eller forholdet nivå (dvs., de er kontinuerlig)., Eksempler på variabler som oppfyller dette kriteriet omfatter revisjon tid (målt i timer), intelligensen (målt ved hjelp av IQ-score), eksamen ytelse (målt fra 0 til 100), vekt (målt i kg), og så videre. Du kan lære mer om intervall og forholdet variabler i våre Typer Variable guide.
- Forutsetning #2: Det er en lineær sammenheng mellom to variabler., Mens det er en rekke måter å sjekke om en lineær relasjon eksisterer mellom to variabler, anbefaler vi at du oppretter et scatterplot ved hjelp av SPSS Statistikk, der du kan plotte en variabel mot andre variable, og så visuelt inspisere scatterplot for å sjekke om linearitet., Din scatterplot kan se ut som noe du ett av følgende:
Hvis forholdet vises i din scatterplot er ikke lineær, må du enten kjøre en nonparametric tilsvarende pearsons korrelasjon eller forvandle dine data, som du kan gjøre ved hjelp av SPSS Statistikk., I vår forbedrede guider, viser vi deg hvordan å: (a) lag et scatterplot for å sjekke for linearitet når du bærer ut pearsons korrelasjon ved hjelp av SPSS Statistikk; (b) tolke ulike scatterplot resultater; og (c) forvandle dine data ved hjelp av SPSS Statistikk hvis det ikke er en lineær sammenheng mellom to variabler.
Merk: pearsons korrelasjon bestemmer i hvilken grad et forhold er lineær. Sagt på en annen måte, det bestemmer om det er en lineær komponent av foreningen mellom to kontinuerlige variabler. Som sådan, linearitet er faktisk ikke en forutsetning om pearsons korrelasjon., Imidlertid, du ville vanligvis ikke ønsker å forfølge en pearsons korrelasjon for å bestemme styrken og retningen av en lineær sammenheng når du allerede vet at forholdet mellom to variabler er ikke lineær. I stedet, forholdet mellom to variabler kan være bedre beskrevet av en annen statistisk mål. På grunn av dette, er det ikke uvanlig å vise sammenhengen mellom to variabler i et scatterplot for å se om du kjører en pearsons korrelasjon er det beste valget som et mål for foreningen, eller om det er et annet mål ville være bedre.,
- Forutsetningen #3: Det skal ikke være noen betydelige uteliggere. Uteliggere er rett og slett enkelt data-poeng innenfor data som ikke følger de vanlige mønster (for eksempel, i en studie av 100 studenter’ IQ skårer, der gjennomsnittlig score var 108 med bare en liten variasjon mellom studenter, den ene studenten hadde en score på 156, noe som er svært uvanlig, og kan selv sette henne i topp 1% av IQ-score globalt)., Følgende scatterplots markere den potensielle effekten av ekstreme verdier:
pearsons korrelasjonskoeffisient, r, er følsom for ekstreme verdier, som kan ha svært stor effekt på linjen for beste passform og Pearson korrelasjonskoeffisient. Derfor, i noen tilfeller, inkludert uteliggere i din analyse kan føre til misvisende resultater. Derfor er det best hvis det er ingen uteliggere, eller de er holdt til et minimum., Heldigvis, ved bruk av SPSS Statistikk for å kjøre pearsons korrelasjon på dine data, kan du enkelt inkludere rutiner for å skjermen for uteliggere. I vår forbedrede pearsons korrelasjon guide, vi: (a) vis hvordan du kan oppdage uteliggere ved hjelp av et scatterplot, som er en enkel prosess ved bruk av SPSS Statistikk; og (b) diskutere noen av mulighetene du har for å håndtere uteliggere.
- Forutsetningen #4: variabler bør være tilnærmet normalfordelt., For å vurdere den statistiske betydningen av Pearson korrelasjon, må du ha bivariate normalitet, men denne forutsetningen er vanskelig å vurdere, slik at en enklere metode er mer vanlig. Denne enklere metode innebærer å bestemme normalitet av hver variabel for seg. For å teste for normalitet du kan bruke Shapiro-Wilk-testen av normalitet, som er lett testet for bruk av SPSS Statistikk. I tillegg til å vise deg hvordan å gjøre dette i våre forbedret pearsons korrelasjon guide, vi forklarer også hva du kan gjøre hvis dataene ikke klarer denne antakelsen.,
Du kan sjekke forutsetninger #2, #3 og #4 ved hjelp av SPSS Statistikk. Husk at hvis du ikke teste disse forutsetningene riktig, resultatene du får når du kjører en pearsons korrelasjon kan ikke være gyldig. Dette er grunnen til at vi vier en rekke deler av vår utvidede pearsons korrelasjon guide for å hjelpe deg med å få dette riktig. Du kan finne ut mer om våre utvidet innhold på våre Funksjoner: Oversikt side, eller mer spesifikt, lære hvordan vi hjelpe med å teste antakelsene våre Funksjoner: Forutsetninger side.,
I avsnittet testprosedyre i SPSS Statistikk, vi illustrere SPSS Statistikk prosedyre for å utføre en pearsons korrelasjon, forutsatt at ingen forutsetninger har blitt brutt. Først setter vi ut eksempelet vi bruker for å forklare pearsons korrelasjon prosedyre i SPSS Statistikk.