What is Heteroscedasticity?

What is Heteroscedasticity?

as Estatísticas são muito divertidas. É cheio de muitas palavras divertidas também, como heteroscedasticidade, também escrito heteroskedasticity. Esta é uma palavra divertida para um tópico bastante estranho. Mas este tópico em particular é essencial para interpretar tantas outras coisas, como a regressão linear. Vamos dar uma olhada mais profunda exatamente no que é heterocedasticidade e como ela é usada.,

Funny Word, Serious Statistics

Essentially, heteroscedasticity is the extent to which the variance of the residuals depends on the predictor variable. Lembre-se que variância é a quantidade de diferença entre o resultado real e o resultado previsto pelo seu modelo. Os resíduos também podem variar do modelo. Os dados são heteroskedásticos se a quantidade que os resíduos variam do modelo muda à medida que a variável predictor muda.

esta pode ser uma definição bastante abstrata, então vamos olhar para um exemplo.digamos que andas a comprar carros., Claro, Você está preocupado com a quilometragem de gás porque quem não está? Uma vez que você está interessado, você decide comparar o número de cilindros do motor para o gás quilometragem. Quando o fizer, terá um gráfico que se parece com este

Existe um padrão geralmente para baixo. Mas ao mesmo tempo, os pontos de dados parecem estar um pouco dispersos. É possível encaixar uma linha de melhor ajuste aos dados. Mas lá falta muita informação.,

a verdade, parece que os pontos de dados estão bastante espalhados no início, aproximar-se e, em seguida, espalhar-se novamente. Hmmm. Isso representa dados heterocedásticos. Isso significa que nosso modelo linear não se encaixa muito bem nos dados, então provavelmente deveríamos ajustá-lo.porquê preocupar-se com heterocedasticidade?

além de ser divertido de dizer, heterocedasticidade representa que os dados são influenciados por algo que você não está contabilizando. Isso geralmente significa que algo mais está acontecendo e nós podemos precisar revisar nosso modelo.,

essencialmente, pode-se verificar a heterocedasticidade comparando os pontos de dados com o eixo x. Se eles se espalharem, ou convergirem, então isso representa que a variabilidade dos resíduos (e, portanto, o modelo) depende do valor da variável independente. Isto não é bom para o nosso modelo. Isto também viola um dos pressupostos da regressão linear. Se os dados são heterocedásticos, então precisamos repensar o nosso modelo.

outras Tidbits

Se os dados podem ser heterocedásticos, então ele pode ser homoscedástico também., Os dados homoscedásticos São quando a variabilidade dos resíduos não varia como a variável independente. Se os seus dados são homoscedásticos, isso é uma coisa boa. Isso significa que o seu modelo conta para as variáveis muito bem, então você deve mantê-lo.

um equívoco comum sobre hetero – e homo-scedasticidade é que tem a ver com as próprias variáveis.

    não tem a ver com as variáveis, apenas com os resíduos!

você precisa ter em mente que os resíduos representam o erro do seu modelo., Se a quantidade de erro em seu modelo muda à medida que as variáveis mudam, então você não tem um modelo muito bom. Em seguida, é hora de voltar à prancheta teórica de desenho.a heterocedasticidade e a homocedasticidade são temas bastante importantes no estudo do funcionamento financeiro ou industrial. Idealmente, os seus dados seriam homoscedásticos, mas há dois tipos de heterocedasticidade, condicional e incondicional.com heterocedasticidade incondicional, a variância dos residuais não é afetada pela variável independente., No entanto, com heterocedasticidade condicional, a variância dos resíduos é afetada por variável independente de alguma forma imprevista. A heterocedasticidade condicional geralmente aparece com dados de séries cronológicas.

TL;DR, heterocedasticidade é a tendência do erro / resíduos a aumentar ou diminuir à medida que a variável independente muda. Isso lhe diz que seu modelo não é estelar porque há algo afetando os dados que você não está contabilizando em seu modelo. Por causa disso, os dados não devem ser heterocedásticos para um bom modelo. Feliz estatística!,

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *