Depois de construir uma máquina modelo de aprendizagem, o próximo passo é avaliar o desempenho do modelo e entender como é bom o nosso modelo é contra um benchmark do modelo., A métrica de avaliação a ser usada dependeria do tipo de problema que você está tentando resolver —se é um problema supervisionado ou não supervisionado, e se é uma classificação ou uma tarefa de regressão.
neste post eu vou falar sobre duas importantes métricas de avaliação usadas para problemas de regressão e destacar a diferença chave entre eles.
R-quadrado, também conhecido como a determinação do coeficiente, define o grau em que a variância na variável dependente (ou alvo) pode ser explicada pela variável independente (características).,
deixe — nos entender isso com um exemplo-digamos que o valor R-quadrado para um determinado modelo aparece como 0,7. Isto significa que 70% da variação da variável dependente é explicada pelas variáveis independentes.idealmente, queremos que as variáveis independentes sejam capazes de explicar toda a variação na variável alvo. Nesse cenário, o valor R-quadrado seria 1. Assim podemos dizer que mais alto o valor R-quadrado, melhor no modelo.,
assim, em termos simples, mais alto o quadrado R, mais variação é explicada por suas variáveis de entrada e, portanto, melhor é o seu modelo. Além disso, o R-quadrado variaria de 0 a 1. Aqui está a fórmula para o cálculo do R-quadrado-
O R-quadrado é calculado dividindo-se a soma dos quadrados dos resíduos do modelo de regressão (dado pelo SSres) pela soma total dos quadrados dos erros do modelo médio (dado pelo SStot) e, em seguida, subtrai-lo a partir de 1.,
Uma desvantagem de r-ao quadrado é que ele assume que cada variável ajuda a explicar a variação no alvo, que pode não ser sempre verdadeiro. Por exemplo, se adicionarmos novos recursos aos dados (que podem ou não ser úteis), o valor R-quadrado para o modelo aumentaria ou permaneceria o mesmo, mas nunca diminuiria.
isto é cuidado por uma versão ligeiramente modificada do R-quadrado, chamado de R-quadrado ajustado.,
R-quadrado ajustado
semelhante ao R-quadrado, O R-quadrado ajustado mede a variação na variável dependente( ou alvo), explicada apenas pelas características que são úteis para fazer previsões. Ao contrário do R-quadrado, O R-quadrado ajustado iria penalizar você por adicionar recursos que não são úteis para prever o alvo.
vamos entender matematicamente como esta característica é acomodada em R-quadrado ajustado., Aqui está a fórmula para ajustada de r-quadrado
Aqui R^2 é o r-ao quadrado calculado, N é o número de linhas e M é o número de colunas. À medida que o número de recursos aumenta, o valor no denominador diminui.
- Se o R2 aumentar significativamente, então o R-quadrado ajustado irá aumentar.se não houver alteração significativa no R2, o r2 ajustado diminuirá.