as Estatísticas são muito divertidas. É cheio de muitas palavras divertidas também, como heteroscedasticidade, também escrito heteroskedasticity. Esta é uma palavra divertida para um tópico bastante estranho. Mas este tópico em particular é essencial para interpretar tantas outras coisas, como a regressão linear. Vamos dar uma olhada mais profunda exatamente no que é heterocedasticidade e como ela é usada.,
Funny Word, Serious Statistics
Essentially, heteroscedasticity is the extent to which the variance of the residuals depends on the predictor variable. Lembre-se que variância é a quantidade de diferença entre o resultado real e o resultado previsto pelo seu modelo. Os resíduos também podem variar do modelo. Os dados são heteroskedásticos se a quantidade que os resíduos variam do modelo muda à medida que a variável predictor muda.
esta pode ser uma definição bastante abstrata, então vamos olhar para um exemplo.digamos que andas a comprar carros., Claro, Você está preocupado com a quilometragem de gás porque quem não está? Uma vez que você está interessado, você decide comparar o número de cilindros do motor para o gás quilometragem. Quando o fizer, terá um gráfico que se parece com este
Existe um padrão geralmente para baixo. Mas ao mesmo tempo, os pontos de dados parecem estar um pouco dispersos. É possível encaixar uma linha de melhor ajuste aos dados. Mas lá falta muita informação.,
a verdade, parece que os pontos de dados estão bastante espalhados no início, aproximar-se e, em seguida, espalhar-se novamente. Hmmm. Isso representa dados heterocedásticos. Isso significa que nosso modelo linear não se encaixa muito bem nos dados, então provavelmente deveríamos ajustá-lo.porquê preocupar-se com heterocedasticidade?
além de ser divertido de dizer, heterocedasticidade representa que os dados são influenciados por algo que você não está contabilizando. Isso geralmente significa que algo mais está acontecendo e nós podemos precisar revisar nosso modelo.,
essencialmente, pode-se verificar a heterocedasticidade comparando os pontos de dados com o eixo x. Se eles se espalharem, ou convergirem, então isso representa que a variabilidade dos resíduos (e, portanto, o modelo) depende do valor da variável independente. Isto não é bom para o nosso modelo. Isto também viola um dos pressupostos da regressão linear. Se os dados são heterocedásticos, então precisamos repensar o nosso modelo.
outras Tidbits
Se os dados podem ser heterocedásticos, então ele pode ser homoscedástico também., Os dados homoscedásticos São quando a variabilidade dos resíduos não varia como a variável independente. Se os seus dados são homoscedásticos, isso é uma coisa boa. Isso significa que o seu modelo conta para as variáveis muito bem, então você deve mantê-lo.
um equívoco comum sobre hetero – e homo-scedasticidade é que tem a ver com as próprias variáveis.
- não tem a ver com as variáveis, apenas com os resíduos!
você precisa ter em mente que os resíduos representam o erro do seu modelo., Se a quantidade de erro em seu modelo muda à medida que as variáveis mudam, então você não tem um modelo muito bom. Em seguida, é hora de voltar à prancheta teórica de desenho.a heterocedasticidade e a homocedasticidade são temas bastante importantes no estudo do funcionamento financeiro ou industrial. Idealmente, os seus dados seriam homoscedásticos, mas há dois tipos de heterocedasticidade, condicional e incondicional.com heterocedasticidade incondicional, a variância dos residuais não é afetada pela variável independente., No entanto, com heterocedasticidade condicional, a variância dos resíduos é afetada por variável independente de alguma forma imprevista. A heterocedasticidade condicional geralmente aparece com dados de séries cronológicas.
TL;DR, heterocedasticidade é a tendência do erro / resíduos a aumentar ou diminuir à medida que a variável independente muda. Isso lhe diz que seu modelo não é estelar porque há algo afetando os dados que você não está contabilizando em seu modelo. Por causa disso, os dados não devem ser heterocedásticos para um bom modelo. Feliz estatística!,