korrelationskoefficient
hvor godt repræsenterer din regressionsligning virkelig
dit datasæt?
En af måderne til at bestemme svaret på dette spørgsmål er at
undersøge korrelationskoefficienten og bestemmelseskoefficienten.,
korrelationskoefficienten, r og |
ud over at vises med regressionsinformationen, kan værdierne rand r 2 findes underVARS, #5 statistik .e. #7 r og #8 r 2.,
korrelationskoefficienten, r :
mængden r, kaldes den lineære korrelationskoefficient, måler styrken og
retning af en lineær sammenhæng mellem to variabler. Den lineære korrelation
– koefficient kaldes undertiden Pearson-produktmomentkorrelationskoefficienten i
ære for dens Udvikler Karl Pearson.
den matematiske formel for computingr er:
hvor n er antallet af datapar.,
(er du ikke glad for, at du har en grafregner, der beregner denne formel?)
værdien af r er sådan, at -1 < r < +1. + Og-tegnene bruges til henholdsvis positive
lineære korrelationer og negative lineære korrelationer.
positiv korrelation: hvis and og y har en stærk positiv lineær korrelation,er r tæt
til +1. En r-værdi på præcis + 1 indikerer en perfekt positiv pasform., Positive værdier
angiver et forhold mellem variables-og y-variabler, således at når værdier for increases stiger, øges
– værdier for y også.
negativ korrelation: hvis If og y har en stærk negativ lineær korrelation,er r tæt
til -1. En R-værdi på nøjagtigt -1 indikerer en perfekt negativ pasform. Negative værdier
angiver et forhold mellem.og y, således at som værdier for increase-stigning falder værdier
for y.
ingen korrelation: hvis der ikke er nogen lineær korrelation eller en svag lineær korrelation, er r
tæt på 0., En værdi nær nul betyder, at der er et tilfældigt, ikke-lineært forhold
mellem de to variabler
Bemærk, at r er en dimensionsløs mængde; det vil sige, det afhænger ikke af de anvendte enheder
.
en perfekt korrelation på 1 1 forekommer kun, når datapunkterne alle ligger nøjagtigt på en
lige linje. Hvis r = + 1, er hældningen af denne linje positiv. Hvis r = -1, hældningen af denne
linje er negativ.
en korrelation større end 0, 8 beskrives generelt som stærk, hvorimod en korrelation
mindre end 0.,5 er generelt beskrevet somsvag. Disse værdier kan variere baseret på
“type” af data, der undersøges. En undersøgelse, der anvender videnskabelige data, kan kræve en stærkere
korrelation end en undersøgelse, der bruger samfundsvidenskabelige data.
Coefficient of Determination, r 2 eller R2 :
determinationskoefficienten, r 2,er nyttigt, fordi det giver den del af
variansen (udsving) af én variabel, der er forudsigelige fra de øvrige variable.,
det er en foranstaltning, der giver os mulighed for at bestemme, hvor sikker man kan være i at lave
forudsigelser fra en bestemt model/graf.
bestemmelseskoefficienten er forholdet mellem den forklarede variation og den samlede
variation.
bestemmelseskoefficienten er sådan, at 0 < r 2 < 1, og angiver styrken
af den lineære forbindelse mellem.og y.,
bestemmelseskoefficienten repræsenterer procentdelen af de data, der er tættest på linjen med bedste pasform. For eksempel, hvis r = 0.922, så R 2 = 0.850, hvilket betyder, at
85% af den samlede variation iny kan forklares ved det lineære forhold mellem<
og y (som beskrevet af regressionsligningen). De øvrige 15% af den samlede variation
I y forbliver uforklarlige.
bestemmelseskoefficienten er et mål for, hvor godt regressionslinjen
repræsenterer dataene., Hvis regressionslinjen passerer nøjagtigt gennem hvert punkt på scatter-plottet, vil den være i stand til at forklare hele variationen. Jo længere linjen er
væk fra punkterne, jo mindre er det i stand til at forklare.