tilastot ovat hauskoja. Se on täynnä myös paljon hauskoja sanoja, kuten heterosedastisuus, kirjoitetaan myös heteroskedastisuus. Tämä on hauska sana melko oudolle aiheelle. Mutta tämä aihe on välttämätöntä tulkita niin monia muita asioita, kuten lineaarinen regressio. Katsotaanpa tarkemmin, mitä heteroskedastisuus on ja miten sitä käytetään.,
Hauska Sana, Vakava Tilastot
Pohjimmiltaan, heteroscedasticity on, missä määrin varianssi residuaalit riippuu predictor variable. Muista, että varianssi on määrä ero todellisen tuloksen ja tulos ennusti, sinun malli. Residuaalit voivat vaihdella myös mallista. Tiedot ovat heteroskedastisia, jos residuaalien määrä vaihtelee mallista prediktorimuuttujan muuttuessa.
tämä voi olla melko abstrakti määritelmä, joten katsotaan esimerkkiä.
sanotaan, että olet autokauppa., Totta kai bensakilometrit huolettavat, koska kukapa ei olisi? Koska olet kiinnostunut, päätät verrata moottorin sylinterien määrää kaasun kilometrimäärään. Kun teet, saat kuvaajan, joka näyttää tältä.
on yleisesti alaspäin kuvio. Mutta samalla datapisteet näyttävät olevan hieman hajallaan. Dataan on mahdollista mahtua parhaiten sopiva rivi. Mutta siellä se kaipaa paljon dataa.,
Itse asiassa, se näyttää datapisteet ovat aika levittää ensin lähemmäs, ja sitten levittää uudelleen. Hmmm. Se edustaa heterosedastista dataa. Tämä tarkoittaa sitä, että lineaarinen malli ei sovi tiedot hyvin, joten meidän pitäisi varmaan säätää sitä.
miksi vaivautua Heterosedastisuuteen?
Muut kuin, että on kiva sanoa, heteroscedasticity merkitsee, että tiedot on vaikuttanut jotain, että et ole osuus. Tämä tarkoittaa yleensä sitä, että jotain muuta on tekeillä ja meidän on ehkä tarkistettava malliamme.,
pohjimmiltaan heterosedastisuuden voi tarkistaa vertaamalla datapisteitä x-akseliin. Jos ne leviävät ulos, tai toisiaan, niin tämä merkitsee, että vaihtelu residuaalit (ja siksi malli) riippuu arvosta riippumaton muuttuja. Tämä ei ole hyväksi mallillemme. Tämä rikkoo myös yhtä lineaarisen regression oletuksista. Jos tiedot ovat heteroskedastisia, meidän on ajateltava malliamme uudelleen.
Muita Makupaloja
Jos tiedot voidaan heteroscedastic, niin se voi olla homoscedastic samoin., Homosedastinen tieto on silloin, kun residuaalien vaihtelevuus ei poikkea toisistaan riippumattoman muuttujan tavoin. Jos tietosi ovat homosedastisia, se on hyvä asia. Se tarkoittaa, että mallisi selittää muuttujat melko hyvin, joten sinun pitäisi pitää se.
yksi yleinen harhaluulo hetero – ja homo-scedastisuudesta on, että se liittyy itse muuttujiin.
- se ei liity muuttujiin, vain residuaaleihin!
sinun täytyy pitää mielessä, että residuaalit edustavat mallisi virhettä., Jos mallisi virhemäärä muuttuu muuttujien muuttuessa, sinulla ei ole kovin hyvää mallia. Sitten on aika palata teoreettiselle piirustuspöydälle.
Hetero – ja homosedastisuus ovat melko tärkeitä aiheita taloudellisen tai teollisen työn opiskelussa. Ihannetapauksessa tietosi olisivat homosedastisia, mutta on olemassa kahdenlaisia heterosedastisia, ehdollisia ja ehdottomia.
ehdoton heteroscedasticity, varianssi residuaalit ei vaikuta riippumaton muuttuja., Kuitenkin heteroskedastisuustestit, varianssi residuaalit vaikuttaa riippumattoman muuttujan joissakin odottamattomissa tavalla. Ehdollinen heteroskedastisuus näkyy yleensä aikasarjadatan mukana.
TL;DR, heteroskedastisuus on virheen / residuaalien taipumus kasvaa tai vähentyä itsenäisten muuttujan muuttuessa. Tämä kertoo, että mallisi ei ole loistava, koska on jotain, joka vaikuttaa tietoihin, joita et ole tilittänyt mallissasi. Tämän vuoksi datan ei pitäisi olla heterosedastista hyvän mallin vuoksi. Iloiset tilastot!,