Statistikk er mye moro. Det er fylt med masse moro ord for, som heteroscedasticity, også stavet heteroskedasticity. Dette er et morsomt ord for en ganske merkelig emnet. Men dette bestemt emne, er viktig for å tolke så mange andre ting, som lineær regresjon. La oss ta en dypere titt inn i akkurat hva heteroscedasticity er og hvordan det brukes.,
Morsomme Ord, Alvorlig Statistikk
Egentlig, heteroscedasticity er i hvilken grad variansen av restene avhenger av prediktor variabel. Husk at variasjon er summen av forskjellen mellom det faktiske utfallet og resultatet spådd av modellen. Rester kan variere fra modell som godt. Dataene er heteroskedastic hvis beløpet som restene variere fra modell endringer som prediktor variabel endringer.
Dette kan være en ganske abstrakt definisjon, så la oss se på et eksempel.
La oss si at du er bilen shopping., Selvfølgelig, du er opptatt med gass kjørelengde på grunn som ikke er det? Siden du er interessert, du bestemmer deg for å sammenligne antall motorens sylindere til gass kjørelengde. Når du gjør det, kan du få en graf som ser ut som dette
Det er en generelt nedadgående mønster. Men på samme tid, data poeng synes å være litt spredt. Det er mulig å passe på en linje som passer best til dataene. Men det savner mye av dataene.,
faktisk, det ser ut som data poeng er ganske spredt ut på først, få nærmere, for så å spre seg ut igjen. Hmmmm. Som representerer heteroscedastic data. Dette betyr at våre lineær modell passer ikke data veldig godt, så vi bør nok justere den.
Hvorfor Bry seg med Heteroscedasticity?
Andre enn å være morsomt å si, heteroscedasticity representerer dataene etter at de er påvirket av noe som du ikke står for. Dette betyr som regel at noe annet er å gå på, og vi kan få behov for å revidere vår modell.,
Egentlig, man kan sjekke for heteroscedasticity ved å sammenligne data poeng til x-aksen. Hvis de spredte seg ut, eller møtes, så dette er at variasjonen av rester (og derfor modellen) avhenger av verdien på den uavhengige variabelen. Dette er ikke bra for vår modell. Dette krenker også en av de forutsetninger for lineær regresjon. Hvis dataene er heteroscedastic, så vi må revurdere vår modell.
Andre Ting
Hvis data kan være heteroscedastic, da kan det være homoscedastic som godt., Homoscedastic data er når variabiliteten av restene varierer ikke som uavhengig variabel gjør. Hvis dataene er homoscedastic, som er en god ting. Det betyr at modellen står for variablene ganske godt, så bør du holde det.
En vanlig misforståelse om hetero – og homo-scedasticity er at det har å gjøre med variabler seg selv.
- Det har ikke å gjøre med variabler, bare restene!
Du trenger å huske på at restene representerer feil i modellen., Hvis mengden av feil i modellen endringer som variablene endres, da du ikke har en meget god modell. Da er det på tide å gå tilbake til den teoretiske tegnebrettet.
Hetero – og homoscedasticity er ganske viktig emner i å studere finansielle eller industrielle virksomheten. Ideelt sett, dine data vil bli homoscedastic, men det er to typer heteroscedasticity, betinget og ubetinget.
Med ubetinget heteroscedasticity, variansen av restene er ikke påvirket av den uavhengige variabelen., Imidlertid, med conditional heteroscedasticity, variansen av restene er påvirket av uavhengige variabelen i noen uforutsette måte. Conditional heteroscedasticity viser vanligvis opp med time series-data.
TL;DR, heteroscedasticity er tendensen av feil/rester for å øke eller redusere som den uavhengige variabelen endres. Dette forteller deg at modellen er ikke stellar fordi det er noe som påvirker data som du ikke regnskap for i modellen. På grunn av dette, data bør ikke være heteroscedastic for en god modell. Glad statistikk!,