Inleiding
De Pearson product-moment correlatie coëfficiënt (kortweg Pearson’ s correlatie) is een maat voor de sterkte en richting van de associatie die bestaat tussen twee variabelen gemeten op ten minste een interval schaal.
bijvoorbeeld, je zou een correlatie van Pearson kunnen gebruiken om te begrijpen of er een verband is tussen examenprestaties en tijd besteed aan het herzien., Je zou ook een Pearson ‘ s correlatie kunnen gebruiken om te begrijpen of er een verband is tussen depressie en de lengte van de werkloosheid.
een Pearson ‘ s correlatie probeert een lijn van best fit door de gegevens van twee variabelen te trekken, en de Pearson correlatiecoëfficiënt, r, geeft aan hoe ver weg al deze gegevenspunten zijn van deze regel van best fit (dat wil zeggen, hoe goed de gegevenspunten passen dit model/regel van best fit). U kunt meer informatie vinden in onze meer algemene gids over Pearson ‘ s correlatie, die wij aanbevelen als u niet bekend bent met deze test.,
opmerking: als een van uw twee variabelen dichotoom is, kunt u in plaats daarvan een punt-biseriële correlatie gebruiken, of als u een of meer controlevariabelen hebt, kunt u een Pearson ‘ s partiële correlatie uitvoeren.
deze “quick start” – gids laat u zien hoe u een Pearson-correlatie kunt uitvoeren met behulp van SPSS-statistieken, en hoe u de resultaten van deze test kunt interpreteren en rapporteren. Voordat we u echter in kennis stellen van deze procedure, moet u de verschillende aannames begrijpen waaraan uw gegevens moeten voldoen om een correlatie tussen Pearson en u een geldig resultaat te geven., We bespreken deze veronderstellingen vervolgens.
SPSS statistieken
aannames
wanneer u ervoor kiest om uw gegevens te analyseren met behulp van Pearson ’s correlatie, bestaat een deel van het proces uit het controleren om ervoor te zorgen dat de gegevens die u wilt analyseren daadwerkelijk kunnen worden geanalyseerd met behulp van Pearson’ s correlatie. U moet dit doen omdat het alleen passend is om Pearson ‘ s correlatie te gebruiken als uw gegevens vier veronderstellingen “passeren” die nodig zijn voor Pearson ‘ s correlatie om u een geldig resultaat te geven., In de praktijk, het controleren van deze vier veronderstellingen voegt gewoon een beetje meer tijd om uw analyse, waarbij u om te klikken van enkele meer knoppen in SPSS statistieken bij het uitvoeren van uw analyse, evenals denken een beetje meer over uw gegevens, maar het is niet een moeilijke taak.
voordat we u in kennis stellen van deze vier veronderstellingen, wees dan niet verbaasd als bij het analyseren van uw eigen gegevens met behulp van SPSS-statistieken, een of meer van deze veronderstellingen wordt geschonden (d.w.z. niet wordt voldaan)., Dit is niet ongewoon bij het werken met real-world data in plaats van leerboek voorbeelden,die vaak alleen laten zien hoe je Pearson ‘ s correlatie uit te voeren wanneer alles goed gaat! Echter, maak je geen zorgen. Zelfs wanneer uw gegevens niet voldoen aan bepaalde veronderstellingen, is er vaak een oplossing om dit te overwinnen. Laten we eerst eens kijken naar deze vier aannames:
- aanname #1: Uw twee variabelen moeten worden gemeten op het interval of ratio niveau (dat wil zeggen, ze zijn continu)., Voorbeelden van variabelen die aan dit criterium voldoen zijn revisietijd (gemeten in uren), intelligentie (gemeten met behulp van IQ-score), examenprestaties (gemeten van 0 tot 100), gewicht (gemeten in kg), enzovoort. Meer informatie over interval-en ratio-variabelen vindt u in onze Gids Voor soorten variabelen.
- aanname # 2: Er is een lineaire relatie tussen uw twee variabelen., Hoewel er een aantal manieren zijn om te controleren of er een lineaire relatie bestaat tussen je twee variabelen, raden we aan om een verstrooiingsplot te maken met behulp van SPSS-statistieken, waar je de ene variabele kunt plotten tegen de andere variabele, en dan het verstrooiingsplot visueel kunt inspecteren om te controleren op lineariteit., Uw scatterplot kan er ongeveer als volgt uitzien:
als de relatie in uw scatterplot niet lineair is, moet u ofwel een niet-parametrisch equivalent uitvoeren met Pearson ‘ s correlatie, ofwel uw gegevens transformeren, wat u kunt doen met behulp van SPSS-statistieken., In onze verbeterde gidsen laten we u zien hoe u: (A) een verstrooiingsplot maakt om lineariteit te controleren bij het uitvoeren van Pearson ‘ s correlatie met SPSS-statistieken; (b) verschillende verstrooiingsresultaten interpreteert; en (c) uw gegevens transformeert met behulp van SPSS-statistieken als er geen lineaire relatie is tussen uw twee variabelen.
opmerking: Pearson ‘ s correlatie bepaalt de mate waarin een relatie lineair is. Anders gezegd, het bepaalt of er een lineaire component van associatie is tussen twee continue variabelen. Als zodanig, lineariteit is niet echt een aanname van Pearson ‘ s correlatie., Echter, je zou normaal gesproken niet een Pearson ‘ s correlatie willen nastreven om de sterkte en richting van een lineaire relatie te bepalen als je al weet dat de relatie tussen je twee variabelen niet lineair is. In plaats daarvan kan de relatie tussen uw twee variabelen beter worden beschreven door een andere statistische maat. Om deze reden is het niet ongewoon om de relatie tussen uw twee variabelen in een scatterplot te bekijken om te zien of het uitvoeren van een Pearson ‘ s correlatie de beste keuze is als een maat van associatie of dat een andere maatregel beter zou zijn.,
- aanname #3: Er mogen geen significante uitschieters zijn. Uitschieters zijn gewoon enkele gegevenspunten binnen uw gegevens die niet het gebruikelijke patroon volgen (bijvoorbeeld, in een studie van 100 studenten’ IQ scores, waar de gemiddelde score was 108 met slechts een kleine variatie tussen studenten, een student had een score van 156, dat is zeer ongebruikelijk, en kan haar zelfs in de top 1% van IQ scores wereldwijd)., De volgende scatterplots benadrukken het potentiële effect van uitschieters:
Pearson ‘ s correlatiecoëfficiënt, r, is gevoelig voor uitschieters, die een zeer groot effect kunnen hebben op de lijn van best fit en de Pearson correlatiecoëfficiënt. Daarom, in sommige gevallen, het opnemen van uitschieters in uw analyse kan leiden tot misleidende resultaten. Daarom is het het beste als er geen uitschieters zijn of ze tot een minimum worden beperkt., Gelukkig kunt u bij het gebruik van SPSS-statistieken Pearson ‘ s correlatie op uw gegevens uitvoeren, eenvoudig procedures opnemen om te screenen op uitschieters. In onze verbeterde Pearson ‘ s correlation guide: (a) laten we u zien hoe u uitschieters kunt detecteren met behulp van een scatterplot, wat een eenvoudig proces is bij het gebruik van SPSS-statistieken; en (b) bespreken we enkele van de beschikbare opties om met uitschieters om te gaan.
- aanname # 4: Uw variabelen moeten ongeveer normaal verdeeld zijn., Om de statistische significantie van de Pearson-correlatie te beoordelen, moet u bivariate normaliteit hebben, maar deze aanname is moeilijk te beoordelen, dus een eenvoudigere methode wordt vaker gebruikt. Deze eenvoudigere methode omvat het bepalen van de normaliteit van elke variabele afzonderlijk. Om op normaliteit te testen kunt u de Shapiro-Wilk-normaliteitstest gebruiken, die gemakkelijk wordt getest voor het gebruik van SPSS-statistieken. We laten u niet alleen zien hoe u dit kunt doen in onze verbeterde Correlatiegids van Pearson, maar we leggen ook uit wat u kunt doen als uw gegevens deze aanname niet halen.,
u kunt aannames #2, #3 en #4 Controleren met behulp van SPSS-statistieken. Vergeet niet dat als u deze aannames niet correct test, de resultaten die u krijgt bij het uitvoeren van een correlatie Pearson ‘ s misschien niet geldig zijn. Daarom wijden we een aantal secties van onze verbeterde Pearson ‘ s correlation guide om u te helpen dit goed te doen. U kunt meer te weten komen over onze verbeterde content op onze pagina Features: Overview, of meer specifiek, leren hoe we helpen met het testen van veronderstellingen op onze pagina Features: veronderstellingen.,
in de sectie testprocedure in SPSS-statistieken illustreren we de SPSS-Statistiekenprocedure om een correlatie van Pearson uit te voeren, ervan uitgaande dat er geen aannames zijn geschonden. Ten eerste geven we het voorbeeld dat we gebruiken om de Correlatieprocedure van Pearson in SPSS-statistieken uit te leggen.