regresjonsanalyser genererer en ligning for å beskrive den statistiske sammenhengen mellom en eller flere prediktor variabler og responsvariabel. Når du bruker Minitab Statistisk Programvare for å passe en regresjonsmodell, og kontroller at de passer ved å kontrollere det gjenværende tomter, vil du ønsker å tolke resultatene. I dette innlegget, skal jeg vise deg hvordan du skal tolke p-verdier og koeffisienter som vises i utdataene for lineære regresjonsanalyser.
Hvordan kan jeg Tolke P-Verdier i Lineære regresjonsanalyser?,
p-verdi for hver term tester nullhypotesen at koeffisienten er lik null (ingen effekt). En lav p-verdi (< 0.05) indikerer at du kan forkaste nullhypotesen. Med andre ord, en prediktor som har en lav p-verdi er sannsynlig å være en meningsfull tillegg til modellen fordi endringer i den predictor verdi er knyttet til endringer i responsvariabel.
Derimot er en større (ubetydelig) p-verdi tyder på at endringer i predictor er ikke forbundet med endringer i den respons.,
I produksjonen under, kan vi se at prediktor variabler av Sør-og Nord er betydelig, fordi begge sine p-verdier er 0.000. Men p-verdien for Øst (0.092) er større enn den vanlige alpha-nivå på 0,05, noe som indikerer at det er ikke statistisk signifikante.
Vanligvis, du bruker koeffisient p-verdi for å fastsette som vilkår for å holde i regresjonsmodellen. I modellen ovenfor, bør vi vurdere å fjerne Østen.
i Slekt: F-test av overordnet betydning
Hvordan kan jeg Tolke Regresjon Koeffisienter for Lineære Relasjoner?,
Regresjon koeffisientene representerer gjennomsnittlig endring i responsvariabel for en enhet av endring i prediktor variabel, samtidig som du holder andre prediktorer i modellen konstant. Dette statistisk kontroll som regresjon gir er viktig fordi den isolerer rollen som en variabel fra alle de andre i modellen.
nøkkelen til å forstå koeffisientene er å tenke på dem som bakkene, og de er ofte kalt skråningen koeffisienter. Jeg vil illustrere dette i den utstyrt linje tomt nedenfor, hvor jeg kommer til å bruke en persons høyde for å modellere sin vekt., Første, Minitab økt vinduet utgang:
Den utstyrt linje plottet viser de samme regresjon resultatene grafisk.
ligningen viser at koeffisienten for høyde i meter er 106.5 kilo. Koeffisienten indikerer at for hver ekstra meter i høyde kan du forvente vekt på å øke med et gjennomsnitt på 106.5 kilo.
Den blå utstyrt grafisk linje viser den samme informasjonen. Hvis du vil flytte til venstre eller høyre langs x-aksen med et beløp som representerer en én meter endring i høyde, er den utstyrt linjen stiger eller faller av 106.5 kilo., Imidlertid, disse høydene er fra midt-skolen i alderen jenter og varierer fra 1,3 m 1,7 m. Forholdet er bare gyldige innenfor disse dataene utvalg, så ville vi faktisk ikke gire opp eller ned linjen av en full meter i dette tilfellet.
Hvis montert linje var flat (a stigningstallet til null), den forventede verdien for vekt vil ikke endre seg, uansett hvor langt opp og ned linjen du går. Så, en lav p-verdi tyder på at skråningen er ikke null, noe som igjen tyder på at endringer i prediktor variabel er forbundet med endringer i responsvariabel.,
jeg brukte en fast linje tomt fordi det bringer virkelig matte til liv. Imidlertid, utstyrt linje tomter kan bare vise resultatene fra enkel regresjon, som er en prediktor variabel og svar. Begrepene hold sant for multippel lineær regresjon, men jeg ville trenge en ekstra romlige dimensjon for hver ekstra prediktor for å plotte resultatene. Det er vanskelig å vise med dagens teknologi!
Hvordan kan jeg Tolke Regresjon Koeffisienter for Kurvelineære sammenhenger og Samspill Vilkår?,
I eksempelet ovenfor, høyden er en lineær effekt; skråningen er konstant, noe som indikerer at effekten er også konstant langs hele utstyrt linje. Imidlertid, hvis modellen krever polynom eller interaksjon vilkår, tolkningen er litt mindre intuitiv.
Som en oppfriskning, polynom vilkår modell skjevheter i dataene, mens samspillet vilkår tyder på at effekten av en prediktor avhenger av verdien for en annen indikasjon.
Den neste eksempel bruker et datasett som krever en kvadratisk (kvadrat) uttrykket til modellen krumning., I produksjonen under, ser vi at p-verdier for både lineære og kvadratiske form er betydelige.
Den gjenværende tomter (ikke vist) indikerer en god passform, slik at vi kan fortsette med den tolkningen. Men, hvordan skal vi tolke disse koeffisientene? Det hjelper virkelig å tegne den i en tilpasset linje tomt.
Du kan se hvordan forholdet mellom maskin innstilling og energiforbruk varierer avhengig av hvor du starter på den utstyrt linje. For eksempel, hvis du starter på en maskin innstilling av 12 og øke innstillingen av 1, du forventer energiforbruk skal reduseres., Men, hvis du starter på 25, en økning på 1 bør øke energiforbruket. Og hvis du er rundt 20, energiforbruk bør ikke endre mye på alle.
En betydelig polynom sikt kan gjøre tolkningen mindre intuitivt fordi effekten av å endre målestokk varierer avhengig av hvilken verdi som prediktor. På samme måte er det et betydelig samspill sikt indikerer at effekten av prediktor varierer avhengig av verdien av en annen målestokk.
vær ekstra forsiktig når du tolker en regresjonsmodell som inneholder disse typer vilkår., Du kan ikke bare se på de viktigste effekten (lineær sikt) og forstå hva som skjer! Dessverre, hvis du utføre multippel regresjonsanalyse, vil du ikke være i stand til å bruke en fast linje tomt til grafisk tolke resultatene. Dette er hvor fagområde kunnskap er ekstra verdifulle!
Spesielt oppmerksomme lesere har kanskje lagt merke til at jeg ikke fortelle deg hvordan du skal tolke konstant. Jeg vil dekke det i mitt neste innlegg!,
sørg for å:
- Sjekk din gjenværende tomter, slik at du kan stole på resultatene
- Vurdere godhet-of-fit og R-squared
Hvis du lærer om regresjon, les min regresjon tutorial!