Le statistiche sono molto divertenti. E ” pieno di un sacco di parole divertenti troppo, come eteroscedasticità, anche scritto eteroskedasticità. Questa è una parola divertente per un argomento piuttosto strano. Ma questo particolare argomento è essenziale per interpretare tante altre cose, come la regressione lineare. Diamo uno sguardo più profondo a cosa sia esattamente l’eteroscedasticità e come viene utilizzata.,
Funny Word, Serious Statistics
Essenzialmente, l’eteroscedasticità è la misura in cui la varianza dei residui dipende dalla variabile predittiva. Ricorda che la varianza è la quantità di differenza tra il risultato effettivo e il risultato previsto dal tuo modello. Anche i residui possono variare dal modello. I dati sono eteroskedastici se l’importo che i residui variano dal modello cambia al variare della variabile predittiva.
Questa può essere una definizione piuttosto astratta, quindi diamo un’occhiata a un esempio.
Diciamo che stai facendo shopping in auto., Certo, sei interessato al chilometraggio del gas perché chi non lo è? Poiché sei interessato, decidi di confrontare il numero di cilindri del motore con il chilometraggio del gas. Quando lo fai, ottieni un grafico simile a questo
C’è un pattern generalmente verso il basso. Ma allo stesso tempo, i punti dati sembrano essere un po ‘ sparsi. È possibile adattare una linea di migliore adattamento ai dati. Ma ci manca un sacco di dati.,
In effetti, sembra che i punti dati siano piuttosto sparsi all’inizio, si avvicinino e poi si allarghino di nuovo. Hmmmm. Questo rappresenta dati eteroscedastici. Ciò significa che il nostro modello lineare non si adatta molto bene ai dati, quindi probabilmente dovremmo regolarlo.
Perché preoccuparsi di eteroscedasticità?
Oltre ad essere divertente da dire, l’eteroscedasticità rappresenta che i dati sono influenzati da qualcosa di cui non si tiene conto. Questo di solito significa che qualcos’altro sta succedendo e potremmo aver bisogno di rivedere il nostro modello.,
Essenzialmente, si può verificare l’eteroscedasticità confrontando i punti dati con l’asse x. Se si diffondono o convergono, allora questo rappresenta che la variabilità dei residui (e quindi il modello) dipende dal valore della variabile indipendente. Questo non va bene per il nostro modello. Ciò viola anche una delle ipotesi di regressione lineare. Se i dati sono eteroscedastici, allora dobbiamo ripensare il nostro modello.
Altre curiosità
Se i dati possono essere eteroscedastici, allora possono essere anche omoscedastici., I dati omoscedastici sono quando la variabilità dei residui non varia come la variabile indipendente. Se i tuoi dati sono omoscedastici, è una buona cosa. Significa che il tuo modello tiene conto delle variabili abbastanza bene, quindi dovresti tenerlo.
Un malinteso comune sull’etero – e omo-scedasticità è che ha a che fare con le variabili stesse.
- Non ha a che fare con le variabili, solo i residui!
È necessario tenere presente che i residui rappresentano l’errore del modello., Se la quantità di errore nel tuo modello cambia man mano che cambiano le variabili, allora non hai un modello molto buono. Quindi è il momento di tornare al tavolo da disegno teorico.
Etero – e omoscedasticità sono argomenti abbastanza importanti nello studio del funzionamento finanziario o industriale. Idealmente, i tuoi dati sarebbero omoscedastici, ma ci sono due tipi di eteroscedasticità, condizionale e incondizionata.
Con eteroscedasticità incondizionata, la varianza dei residui non è influenzata dalla variabile indipendente., Tuttavia, con l’eteroscedasticità condizionale, la varianza dei residui è influenzata dalla variabile indipendente in qualche modo imprevisto. L’eteroscedasticità condizionale di solito si presenta con i dati delle serie temporali.
TL;DR, l’eteroscedasticità è la tendenza degli errori / residui ad aumentare o diminuire al variare della variabile indipendente. Questo ti dice che il tuo modello non è stellare perché c’è qualcosa che influenza i dati che non stai contabilizzando nel tuo modello. Per questo motivo, i dati non dovrebbero essere eteroscedastici per un buon modello. Statistiche felici!,