regressziós analízis egyenletet generál egy vagy több prediktorváltozó és a válaszváltozó közötti statisztikai kapcsolat leírására. Miután a Minitab statisztikai szoftvert egy regressziós modellhez illesztette, majd a maradék parcellák ellenőrzésével ellenőrizte az illesztést, az eredményeket értelmezni szeretné. Ebben a bejegyzésben megmutatom, hogyan kell értelmezni a lineáris regressziós analízis kimenetén megjelenő p-értékeket és együtthatókat.
hogyan Értelmezhetem a P-értékeket lineáris regressziós analízisben?,
A P-érték minden egyes kifejezésre azt a null hipotézist teszteli, hogy az együttható nulla (nincs hatás). Az alacsony p-érték (< 0.05) azt jelzi, hogy elutasíthatja a null hipotézist. Más szavakkal, az alacsony p-értékkel rendelkező prediktor valószínűleg értelmes kiegészítés a modellhez, mivel a prediktor értékének változásai a válaszváltozó változásaihoz kapcsolódnak.
ezzel szemben egy nagyobb (jelentéktelen) p-érték azt sugallja, hogy a prediktor változásai nem kapcsolódnak a válasz változásaihoz.,
az alábbi kimenetben láthatjuk, hogy a déli és északi prediktorváltozók jelentősek, mivel mindkét p-értékük 0,000. A keleti P-érték (0,092) azonban nagyobb, mint a 0,05-ös közös alfa-szint, ami azt jelzi, hogy statisztikailag nem szignifikáns.
általában a p-értékek együtthatóját használja annak meghatározására, hogy mely kifejezéseket kell tartani a regressziós modellben. A fenti modellben fontolóra kell vennünk Kelet eltávolítását.
kapcsolódó: F-általános szignifikancia vizsgálata
hogyan Értelmezhetem a lineáris kapcsolatok regressziós együtthatóit?,
a regressziós együtthatók a válaszváltozó átlagos változását jelentik a prediktor változóban egy változásegységben, miközben a modell állandójában más prediktorokat tartanak. Ez a statisztikai ellenőrzés, amelyet a regresszió biztosít, azért fontos, mert elkülöníti az egyik változó szerepét a modell többi részétől.
az együtthatók megértésének kulcsa az, hogy lejtőknek tekintjük őket, és gyakran lejtési együtthatóknak nevezik őket. Ezt illusztrálom az alábbi felszerelt vonaltervben, ahol egy személy magasságát fogom használni a súlyuk modellezéséhez., Először is, a Minitab munkamenet ablak kimenete:
Az illesztett vonalrajz grafikusan ugyanazokat a regressziós eredményeket mutatja.
az egyenlet azt mutatja, hogy a méterben mért magasság együtthatója 106,5 kilogramm. Az együttható azt jelzi, hogy minden további méter magasságra számíthat arra, hogy a súly átlagosan 106,5 kilogrammal nő.
a kék vonal grafikusan ugyanazt az információt mutatja. Ha az x tengely mentén balra vagy jobbra mozog egy méter magasságváltozást jelentő összeggel, akkor a felszerelt vonal 106,5 kilogrammal emelkedik vagy esik., Azonban ezeket a magasságokat a közép-iskolai korú lányok tól 1,3 m 1,7 m. A kapcsolat csak akkor érvényes, ezen belül az adatok körét, tehát valójában nem a shift felfelé vagy lefelé a vonal teljes méter ebben az esetben.
Ha a felszerelt vonal lapos (nulla lejtési együttható), a súly várható értéke nem változik, függetlenül attól, hogy milyen messzire felfelé vagy lefelé halad. Tehát egy alacsony p-érték azt sugallja, hogy a lejtés nem nulla, ami viszont azt sugallja, hogy a prediktor változóban bekövetkező változások a válaszváltozóban bekövetkező változásokhoz kapcsolódnak.,
egy felszerelt vonalrajzot használtam, mert valóban életre kelti a matematikát. Az illesztett vonalrajzok azonban csak az egyszerű regresszió eredményeit jeleníthetik meg, ami egy prediktor változó és a válasz. A fogalmak igazak a többszörös lineáris regresszióhoz, de szükségem lenne egy extra térbeli dimenzióra minden további prediktor számára az eredmények ábrázolásához. Ezt nehéz megmutatni a mai technológiával!
hogyan Értelmezhetem a görbületi kapcsolatok és interakciók regressziós együtthatóit?,
a fenti példában a magasság lineáris hatás; a lejtés állandó, ami azt jelzi, hogy a hatás a teljes felszerelt vonal mentén is állandó. Ha azonban a modell polinom vagy interakciós kifejezéseket igényel, az értelmezés kissé kevésbé intuitív.
frissítőként polinom kifejezések modell görbület az adatokban, míg az interakciós kifejezések azt jelzik, hogy az egyik prediktor hatása egy másik prediktor értékétől függ.
a következő példa olyan adatkészletet használ, amely a görbület modellezéséhez négyzetes (négyzetes) kifejezést igényel., Az alábbi kimenetben látjuk, hogy mind a lineáris, mind a kvadratikus kifejezések p-értékei jelentősek.
a maradék parcellák (nem jelennek meg) jó illeszkedést jeleznek, így folytathatjuk az értelmezést. De hogyan értelmezzük ezeket az együtthatókat? Ez tényleg segít, hogy grafikon, hogy egy felszerelt vonal telek.
láthatja, hogy a gép beállítása és az energiafogyasztás közötti kapcsolat hogyan változik attól függően, hogy hol indul a felszerelt vonalon. Például, ha 12-es gépbeállítással indul, és 1-gyel növeli a beállítást,akkor az energiafogyasztás csökkenésére számít., Ha azonban 25-kor kezdődik, az 1-es növekedésnek növelnie kell az energiafogyasztást. És ha 20 éves vagy, az energiafogyasztás nem sokat változhat.
egy jelentős polinom kifejezés az értelmezést kevésbé intuitívvá teheti, mivel a prediktor megváltoztatásának hatása az adott prediktor értékétől függően változik. Hasonlóképpen, egy jelentős interakciós kifejezés azt jelzi, hogy a prediktor hatása egy másik prediktor értékétől függően változik.
különös figyelmet kell fordítani az ilyen típusú kifejezéseket tartalmazó regressziós modell értelmezésekor., Nem lehet csak nézni a fő hatás (lineáris kifejezés), és megérteni, hogy mi történik! Sajnos, ha többszörös regressziós analízist végez, akkor az eredmények grafikus értelmezéséhez nem lesz képes egy felszerelt vonalrajzot használni. Ez az, ahol a tárgy terület ismerete extra értékes!
különösen figyelmes olvasók észrevették, hogy nem mondtam el, hogyan kell értelmezni az állandót. Ezt majd a következő posztomon fedezem!,
ügyeljen arra, hogy:
- ellenőrizze a maradék parcellák, így bízhat az eredmények
- értékeli a jóság-of-fit és R-négyzet
ha tanulsz regresszió, olvassa el a regressziós bemutató!