Regresní analýzy generuje rovnice k popisu statistického vztahu mezi jedním nebo více prognostických proměnných a proměnné odezvy. Po použití statistického softwaru Minitab, aby se vešly regresní model, a ověřit fit kontrolou zbytkové pozemky, budete chtít interpretovat výsledky. V tomto příspěvku vám ukážu, jak interpretovat hodnoty p a koeficienty, které se objevují na výstupu pro lineární regresní analýzu.
jak interpretovat hodnoty P v lineární regresní analýze?,
hodnota p pro každý termín testuje nulovou hypotézu, že koeficient se rovná nule (žádný účinek). Nízká hodnota p (< 0.05) znamená, že můžete odmítnout nulovou hypotézu. Jinými slovy, prediktor, který má nízkou hodnotu p, bude pravděpodobně smysluplným doplňkem vašeho modelu, protože změny hodnoty prediktoru souvisejí se změnami v proměnné odezvy.
naopak větší (nevýznamná) hodnota p naznačuje, že změny v prediktoru nejsou spojeny se změnami v odpovědi.,
ve výstupu níže vidíme, že prediktorové proměnné jihu a severu jsou významné, protože obě jejich hodnoty p jsou 0.000. Hodnota p pro východ (0, 092) je však větší než společná alfa hladina 0, 05, což naznačuje, že není statisticky významná.
obvykle se pomocí koeficientu p-hodnoty určit, které podmínky, aby v regresním modelu. Ve výše uvedeném modelu bychom měli zvážit odstranění východu.
související: F-test celkové významnosti
jak interpretuji regresní koeficienty pro lineární vztahy?,
Regresní koeficienty představují průměrnou změnu vysvětlované proměnné o jednu jednotku změnit v prognostická proměnná, zatímco drží další prediktory v modelu konstantní. Tato Statistická kontrola, kterou regrese poskytuje, je důležitá, protože izoluje roli jedné proměnné od všech ostatních v modelu.
klíčem k pochopení koeficientů je myslet na ně jako na svahy a často se jim říká koeficienty sklonu. Ilustruji to na přiloženém řádku níže, kde použiji výšku člověka k modelování jejich hmotnosti., Za prvé, výstup okna relace Minitab:
graf osazené čáry zobrazuje graficky stejné regresní výsledky.
rovnice ukazuje, že koeficient pro výšku v metrech je 106,5 kilogramu. Koeficient ukazuje, že pro každý další metr na výšku můžete očekávat zvýšení hmotnosti v průměru o 106,5 kilogramu.
modrá osazená čára graficky zobrazuje stejné informace. Pokud se budete pohybovat doleva nebo doprava podél osy x o částku, která představuje jeden metr změně výšky, vybavená linka stoupá nebo klesá podle 106.5 kg., Nicméně, tyto výšky jsou od středního školního věku dívky a v rozmezí od 1,3 m do 1,7 m. Vztah je platný pouze v tomto rozsahu dat, takže bychom vlastně posun nahoru nebo dolů, řádek po celou čtvereční v tomto případě.
Pokud by osazená čára byla plochá (koeficient sklonu nula), očekávaná hodnota hmotnosti by se nezměnila bez ohledu na to, jak daleko nahoru a dolů po linii jdete. Takže, nízká p-hodnota naznačuje, že sklon není nula, což naznačuje, že změny v prediktor proměnnou jsou spojeny se změnami v proměnné odezvy.,
použil jsem osazený řádek, protože to opravdu přináší matematiku k životu. Nicméně, vybaven linky grafy lze zobrazit pouze výsledky z jednoduché regrese, což je jedna prognostická proměnná a reakce. Koncepty platí pro vícenásobnou lineární regresi, ale pro každý další prediktor bych potřeboval další prostorový rozměr pro vykreslení výsledků. To je těžké ukázat s dnešní technologií!
jak interpretovat regresní koeficienty pro křivočaré vztahy a interakční pojmy?,
ve výše uvedeném příkladu je výška lineárním efektem; sklon je konstantní, což znamená, že účinek je také konstantní podél celé namontované čáry. Pokud však váš model vyžaduje polynomiální nebo interakční pojmy, interpretace je o něco méně intuitivní.
jako opakovací, polynomiální pojmy model zakřivení v datech, zatímco podmínky interakce naznačují, že účinek jednoho prediktoru závisí na hodnotě jiného prediktoru.
následující příklad používá datovou sadu, která vyžaduje kvadratický (čtvercový) termín pro modelování zakřivení., Na výstupu níže vidíme, že hodnoty p pro lineární i kvadratické termíny jsou významné.
zbytkové grafy (nejsou zobrazeny) naznačují dobrou kondici, takže můžeme pokračovat v interpretaci. Ale jak interpretujeme tyto koeficienty? Opravdu to pomáhá grafovat v osazeném řádku.
můžete vidět, jak se vztah mezi nastavením stroje a spotřebou energie liší v závislosti na tom, kde začnete na namontované lince. Pokud například začnete s nastavením stroje 12 a zvýšíte nastavení o 1, očekáváte snížení spotřeby energie., Pokud však začnete na 25, zvýšení o 1 by mělo zvýšit spotřebu energie. A pokud vám je kolem 20 let, spotřeba energie by se vůbec neměla měnit.
významný polynomický termín může učinit interpretaci méně intuitivní, protože účinek změny prediktoru se liší v závislosti na hodnotě tohoto prediktoru. Podobně významný interakční termín naznačuje, že účinek prediktoru se liší v závislosti na hodnotě jiného prediktoru.
při interpretaci regresního modelu, který obsahuje tyto typy pojmů, věnujte zvláštní pozornost., Nemůžete se jen podívat na hlavní efekt (lineární termín) a pochopit, co se děje! Bohužel, pokud provádíte vícenásobnou regresní analýzu,nebudete moci graficky interpretovat výsledky pomocí osazené čáry. To je místo, kde předmět oblast znalosti je mimořádně cenné!
zvláště pozorní čtenáři si možná všimli, že jsem vám neřekl, jak interpretovat konstantu. Budu to krýt ve svém dalším příspěvku!,
ujistěte se, že:
- zkontrolujte zbytkové pozemky, abyste mohli důvěřovat výsledkům
- posoudit dobrotu a R-na druhou
Pokud se učíte o regresi, přečtěte si můj regresní tutoriál!