regressioanalyysi tuottaa yhtälön kuvaamaan tilastollista suhdetta yhden tai useamman ennustaja muuttujat ja vastemuuttuja. Kun käytät Minitab tilastollinen ohjelmisto sopimaan regressiomalli, ja tarkistaa sopivuus tarkistamalla jäljellä tontteja, haluat tulkita tuloksia. Tässä viestissä, näytän miten tulkita p-arvot ja kertoimet, jotka näkyvät lähtö lineaarisen regressioanalyysin.
miten tulkitsen P-arvot lineaarisessa Regressioanalyysissä?,
p-arvo kullekin aikavälillä testaa nollahypoteesia, että kerroin on nolla (ei vaikutusta). Alhainen p-arvo (< 0.05) osoittaa, että voit hylätä nollahypoteesi. Toisin sanoen, ennustaja, joka on alhainen p-arvo on todennäköisesti merkityksellistä lisäksi oma malli, koska muutokset predictor-arvoon liittyvät muutokset vastemuuttuja.
Toisaalta, suurempi (merkityksetön) p-arvo viittaa siihen, että muutokset ennustaja ei liity muutoksia vastausta.,
lähtö alla, voimme nähdä, että ennustaja muuttujat Etelä-ja Pohjois-ovat merkittäviä, koska sekä niiden p-arvot 0.000. Idän p-arvo (0,092) on kuitenkin suurempi kuin yleinen alfataso 0,05, mikä osoittaa, ettei se ole tilastollisesti merkitsevä.
tyypillisesti käytetään kerrointa p-arvot määrittämään, mitkä termit regressiomallissa säilytetään. Yllä olevassa mallissa pitäisi harkita idän poistamista.
aiheeseen Liittyvät: F-testi yleinen merkitys
Miten Tulkitsen Regression Kertoimet Lineaarisen Suhteita?,
Regressio-kertoimet edustavat keskimääräinen muutos vastemuuttuja yhden yksikön muutos predictor variable pitäen muita ennustajia mallissa vakio. Tämä regression tarjoama tilastollinen kontrolli on tärkeä, koska se eristää yhden muuttujan roolin kaikista muista mallissa olevista.
kertoimien ymmärtämisen avain on ajatella niitä rinteinä, ja niitä kutsutaan usein rinnekertoimiksi. Voin havainnollistaa tätä varustettu line tontin alla, jossa käytän henkilön korkeus malli niiden paino., Ensinnäkin Minitabin istuntoikkunan ulostulo:
asennettu rivijännite näyttää samat regressiotulokset graafisesti.
yhtälö osoittaa, että kerroin korkeus metreinä on 106.5 kiloa. Kerroin osoittaa, että jokainen ylimääräinen metri korkeutta voit odottaa paino kasvaa keskimäärin 106.5 kiloa.
sininen asennettu viiva osoittaa graafisesti samat tiedot. Jos siirrät vasemmalle tai oikealle pitkin x-akselin, jonka määrä, joka edustaa yksi metri muutos korkeus, varustettu linja nousee tai laskee 106.5 kiloa., Kuitenkin, nämä korkeudet ovat peräisin lähi-koulu-vuotiaiden tyttöjen ja vaihtelevat 1,3 m 1,7 m. Suhde on voimassa vain tämän data-alueelle, niin meillä ei olisi oikeastaan siirtää ylös tai alas rivi täysi mittari tässä tapauksessa.
Jos asennettu linja olisi tasainen (kaltevuuskerroin nolla), painon odotusarvo ei muuttuisi riippumatta siitä, kuinka pitkälle linjaa pitkin mennään. Joten, pieni p-arvo viittaa siihen, että rinne ei ole nolla, mikä puolestaan viittaa siihen, että muutokset predictor variable liittyvät muutokset vastemuuttuja.,
käytin sovitettua viivajuonta, koska se todella herättää matikan eloon. Kuitenkin, varustettu linja tontteja voi näyttää vain tulokset yksinkertainen regressio, joka on yksi ennustaja muuttujan ja vastaus. Käsitteet pitävät paikkansa usean lineaarisen regression osalta, mutta tarvitsen ylimääräisen spatiaalisen ulottuvuuden jokaista ylimääräistä predikaattoria varten tulosten kuvaamiseksi. Sitä on vaikea näyttää nykypäivän teknologialla!
Miten Tulkitsen Regression Kertoimet Kaareva Suhteita ja Vuorovaikutuksen Kannalta?,
yllä olevassa esimerkissä, korkeus on lineaarinen vaikutus; kaltevuus on vakio, joka osoittaa, että vaikutus on myös jatkuvasti pitkin koko asennettu linja. Kuitenkin, jos malli vaatii polynomi tai vuorovaikutuksen kannalta tulkinta on hieman vähemmän intuitiivinen.
kertaus, polynomin termit malli kaarevuus tiedot, kun taas vuorovaikutuksen ehdot osoittavat, että vaikutus yksi ennustaja riippuu arvosta toinen ennustaja.
seuraavassa esimerkissä käytetään tietokokonaisuutta, joka vaatii kaarevuuden mallintamiseen quadratic (squared) – termin., Alla olevassa tuotoksessa näemme, että sekä lineaaristen että quadratisten termien p-arvot ovat merkittäviä.
jäännöspalstat (ei esitetty) osoittavat hyvän istuvuuden, joten voimme edetä tulkinnassa. Mutta miten näitä kertoimia tulkitaan? Se todella auttaa kuvaamaan sen asennettu linja juoni.
näet, miten koneen asetelman ja energiankulutuksen suhde vaihtelee riippuen siitä, mistä asennetulla linjalla aloitetaan. Jos esimerkiksi aloittaa koneasetuksella 12 ja kasvattaa asetusta 1: llä, energiankulutuksen voisi olettaa vähenevän., Kuitenkin, jos aloitat 25, kasvu 1 pitäisi lisätä energiankulutusta. Ja jos on noin 20-vuotias, energiankulutuksen ei pitäisi juurikaan muuttua.
merkittävä polynomin termi voi tehdä tulkinnan vähemmän intuitiivinen, koska vaikutus muuttaa ennustaja vaihtelee riippuen arvosta, että ennustaja. Samoin merkittävä vuorovaikutuksen termi osoittaa, että vaikutus ennustaja vaihtelee riippuen arvosta eri predictor.
ole erityisen varovainen tulkitessasi regressiomallia, joka sisältää tämäntyyppisiä termejä., Et voi vain katsoa päävaikutusta (lineaarinen termi) ja ymmärtää, mitä tapahtuu! Valitettavasti, jos suoritat useita regressioanalyysi, et voi käyttää asennettua line juoni graafisesti tulkitsemaan tuloksia. Täällä aihealuetuntemus on erityisen arvokasta!
erityisen tarkkaavaiset lukijat ovat saattaneet huomata, etten kertonut, miten vakiota tulkitaan. Hoidan sen seuraavassa postauksessani!,
muista:
- Tarkista jäljellä tontteja, joten voit luottaa tuloksia
- Arvioida, hyvyys-of-fit-ja R-squared
Jos olet oppia regressio, lue minun regressio opetusohjelma!