Úvod
produktu okamžik Pearson korelační koeficient (Pearsonův korelační, pro krátké) je měřítkem síly a směru sdružení, které existuje mezi dvě proměnné měřené na alespoň intervalové stupnici.
například byste mohli použít pearsonovu korelaci, abyste pochopili, zda existuje souvislost mezi výkonem zkoušky a časem stráveným revizí., Můžete také použít pearsonovu korelaci, abyste pochopili, zda existuje souvislost mezi depresí a délkou nezaměstnanosti.
Pearsonův korelační pokusí nakreslit čáru nejlepší fit přes data dvou proměnných, a Pearsonův korelační koeficient, r, udává, jak daleko všechny tyto datové body jsou z této řady nejlepší kondici (tj. jak dobře datové body fit tento model/line of best fit). Více se můžete dozvědět v naší obecnější návod, Pearsonova korelace, které doporučujeme, pokud nejste obeznámeni s tímto testem.,
Poznámka: Pokud se jeden z vašich dvou proměnných je dichotomické můžete použít bodové biserial korelace, místo, nebo, pokud máte jeden nebo více kontrolních proměnných, můžete spustit Pearson je parciální korelace.
tato příručka „rychlý start“ vám ukáže, jak provést pearsonovu korelaci pomocí statistik SPSS, stejně jako interpretovat a hlásit výsledky tohoto testu. Než vás však seznámíme s tímto postupem, musíte pochopit různé předpoklady, které musí vaše údaje splňovat, aby vám Pearsonova korelace poskytla platný výsledek., O těchto předpokladech budeme diskutovat dále.
SPSS Statistics
Předpoklady
Pokud se rozhodnete analyzovat data pomocí Pearsonova korelace, část procesu zahrnuje kontrolu, aby se ujistil, že data, která chcete analyzovat, můžete ve skutečnosti být analyzovány pomocí Pearsonova korelace. Musíte to udělat, protože to je jen vhodné použít Pearsonův korelační pokud vaše data „projde“ čtyři předpoklady, které jsou nutné pro Pearsonův korelační aby vám platný výsledek., V praxi, kontrola pro tyto čtyři předpoklady, jen přidává trochu více času pro analýzu, bylo nutné, aby klikněte na několik tlačítek v SPSS Statistics při provádění své analýzy, stejně jako si myslím, že trochu více o vaše data, ale to není obtížný úkol.
předtím, Než vám představíme tyto čtyři předpoklady, nebuďte překvapeni, pokud se při analýze vlastních dat pomocí SPSS Statistics, jeden nebo více z těchto předpokladů je porušena (tj. není splněna)., To není neobvyklé při práci s daty v reálném světě spíše než příklady učebnic, které vám často ukazují, jak provést pearsonovu korelaci, když vše půjde dobře! Nicméně, nebojte se. I když vaše data selže určité předpoklady, často existuje řešení, jak to překonat. Nejprve se podívejme na tyto čtyři předpoklady:
- předpoklad #1: Vaše dvě proměnné by měly být měřeny na úrovni intervalu nebo poměru (tj., Příklady proměnných, které splňují tato kritéria zahrnují revize času (měřeno v hodinách), inteligence (měří pomocí IQ skóre), zkouška výkonu (měřeno od 0 do 100), hmotnosti (vyjádřené v kg), a tak dále. Více informací o intervalových a poměrných proměnných se dozvíte v našich typech variabilního průvodce.
- předpoklad #2: mezi vašimi dvěma proměnnými Existuje lineární vztah., Zatímco existuje řada způsobů, jak zkontrolovat, zda lineární vztah existuje mezi dvěma proměnnými, jsme se navrhnout vytvoření scatterplot pomocí SPSS Statistics, kde si můžete spiknutí jedné proměnné vůči druhé proměnné, a poté vizuálně zkontrolujte scatterplot pro kontrolu linearity., Vaše scatterplot může vypadat podobně jako jednu z následujících akcí:
Pokud vztah zobrazeny v scatterplot není lineární, budete muset buď spustit neparametrický ekvivalent Pearsonův korelační nebo transformovat vaše data, které můžete udělat pomocí SPSS Statistics., V naší rozšířené průvodci vám ukážeme, jak na to: (a) vytvořit scatterplot pro kontrolu linearity při provádění Pearsonův korelační pomocí SPSS Statistics; (b) interpretovat různé výsledky scatterplot; a (c) transformace dat pomocí SPSS Statistics, jestli tam není lineární vztah mezi dvěma proměnnými.
Poznámka: Pearsonova korelace určuje, do jaké míry je vztah lineární. Jiným způsobem určuje, zda existuje lineární složka spojení mezi dvěma spojitými proměnnými. Linearita jako taková není ve skutečnosti předpokladem Pearsonovy korelace., Nicméně, by za normálních okolností chtějí pokračovat v Pearsonův korelační určit sílu a směr lineární vztah, když už víte, že vztah mezi dvěma proměnnými není lineární. Místo toho může být vztah mezi vašimi dvěma proměnnými lépe popsán jiným statistickým opatřením. Z tohoto důvodu, to není neobvyklé pro zobrazení vztahu mezi dvěma proměnnými v scatterplot, jestli běží Pearsonův korelační je nejlepší volbou jako míra asociace, nebo zda další opatření by bylo lepší.,
- předpoklad #3: neměly by existovat žádné významné odlehlé hodnoty. Odlehlé hodnoty jsou jen jednotlivé datové body ve vašem údaje, které nejsou podle obvyklého vzoru (např. ve studii z 100 studentů IQ, kde průměrné skóre bylo 108 s jen malými rozdíly mezi studenty, jeden student měl skóre 156, což je velmi neobvyklé, a může dokonce dát ji do top 1% IQ skóre po celém světě)., Následující scatterplots upozornit na potenciální vliv odlehlých hodnot:
Pearsonův korelační koeficient, r, je citlivý na odlehlé hodnoty, které mohou mít velmi velký vliv na nejlepší fit a Pearsonův korelační koeficient. Proto v některých případech, včetně odlehlých hodnot ve vaší analýze, může vést k zavádějícím výsledkům. Proto je nejlepší, pokud neexistují žádné odlehlé hodnoty nebo jsou omezeny na minimum., Naštěstí při použití statistik SPSS ke spuštění pearsonovy korelace na vašich datech můžete snadno zahrnout postupy pro zobrazení odlehlých hodnot. V naší rozšířené Pearsonův korelační průvodce, jsme se: (a) ukázat vám, jak k detekci odlehlých hodnot pomocí scatterplot, který je jednoduchý proces, při použití SPSS Statistics; a (b) diskutovat o některé z možností k dispozici pro vás, aby se vypořádat s odpadlíky.
- předpoklad #4: Vaše proměnné by měly být přibližně normálně distribuovány., Aby bylo možné posoudit statistickou významnost Pearsonovy korelace, musíte mít bivariátní normálnost, ale tento předpoklad je obtížné posoudit, takže se častěji používá jednodušší metoda. Tato jednodušší metoda zahrnuje stanovení normality každé proměnné zvlášť. Chcete-li otestovat normálnost, můžete použít test normality Shapiro-Wilk, který je snadno testován pro použití statistik SPSS. Kromě toho ukazuje, jak to udělat v naší vylepšenou Pearsonův korelační průvodce, jsme také vysvětlit, co můžete udělat, pokud vaše data se nezdaří tento předpoklad.,
pomocí statistik SPSS můžete zkontrolovat předpoklady #2, #3 a #4. Nezapomeňte, že pokud tyto předpoklady netestujete správně, výsledky, které získáte při spuštění pearsonovy korelace, nemusí být platné. To je důvod, proč věnujeme řadu sekcí našeho vylepšeného Pearsonova korelačního průvodce, který vám pomůže získat toto právo. O našem vylepšeném obsahu se můžete dozvědět na našich funkcích: přehledová stránka, nebo konkrétněji, Naučte se, jak pomáháme s testovacími předpoklady o našich funkcích: stránka předpokladů.,
V sekci, Test, Postup v SPSS, Statistiky, můžeme ilustrovat SPSS Statistics postup provést Pearsonův korelační za předpokladu, že žádné předpoklady byly porušeny. Nejprve jsme uvedli příklad, který používáme k vysvětlení korelačního postupu Pearsona ve statistikách SPSS.