Cómo interpretar los resultados del análisis de regresión: valores y coeficientes p

El análisis de regresión genera una ecuación para describir la relación estadística entre una o más variables predictoras y la variable de respuesta. Después de usar el Software estadístico de Minitab para ajustar un modelo de regresión y verificar el ajuste comprobando las gráficas residuales, querrá interpretar los resultados. En este post, te mostraré cómo interpretar los valores de p y coeficientes que aparecen en la salida para el análisis de regresión lineal.

¿cómo interpreto los valores de P en el análisis de regresión lineal?,

el valor p para cada término prueba la hipótesis nula de que el coeficiente es igual a cero (sin efecto). Un valor p bajo (< 0.05) indica que puede rechazar la hipótesis nula. En otras palabras, un predictor que tiene un valor p bajo es probable que sea una adición significativa a su modelo porque los cambios en el valor del predictor están relacionados con los cambios en la variable de respuesta.

por el contrario, un valor p mayor (insignificante) sugiere que los cambios en el predictor no están asociados con cambios en la respuesta.,

en la salida a continuación, podemos ver que las variables predictoras de Sur y norte son significativas porque ambos de sus valores de p son 0.000. Sin embargo, el valor de P Para East (0.092) es mayor que el nivel alfa común de 0.05, lo que indica que no es estadísticamente significativo.

normalmente, se utilizan los valores p del coeficiente para determinar qué términos mantener en el modelo de regresión. En el modelo anterior, debemos considerar la eliminación de este.

relacionado: F-test de significación global

¿cómo interpreto los coeficientes de regresión para las relaciones lineales?,

los coeficientes de regresión representan el cambio medio en la variable de respuesta para una unidad de cambio en la variable predictora mientras se mantienen constantes otros predictores en el modelo. Este control estadístico que proporciona la regresión es importante porque aísla el papel de una variable de todas las demás en el modelo.

la clave para entender los coeficientes es pensar en ellos como pendientes, y a menudo se les llama coeficientes de pendiente. Ilustraré esto en el gráfico de línea ajustada a continuación, donde usaré la altura de una persona para modelar su peso., Primero, Salida de la ventana de sesión de Minitab:

el gráfico de línea ajustada muestra los mismos resultados de regresión gráficamente.

la ecuación muestra que el coeficiente de altura en metros es de 106,5 kilogramos. El coeficiente indica que por cada metro adicional de altura puede esperar que el peso aumente en un promedio de 106.5 kilogramos.

la línea ajustada azul muestra gráficamente la misma información. Si se mueve a la izquierda o a la derecha a lo largo del eje x en una cantidad que representa un cambio de un metro de altura, la línea ajustada aumenta o disminuye en 106.5 kilogramos., Sin embargo, estas alturas son de niñas en edad de escuela media y varían de 1.3 m a 1.7 m. la relación solo es válida dentro de este rango de datos, por lo que en realidad no cambiaríamos la línea por un metro completo en este caso.

si la línea ajustada fuera plana (un coeficiente de pendiente de cero), el valor esperado para el peso no cambiaría sin importar cuán arriba y abajo de la línea vaya. Por lo tanto, un valor p bajo sugiere que la pendiente no es cero, lo que a su vez sugiere que los cambios en la variable predictora están asociados con cambios en la variable de respuesta.,

utilicé una gráfica de línea ajustada porque realmente da vida a las matemáticas. Sin embargo, los gráficos de línea ajustados solo pueden mostrar los resultados de la regresión simple, que es una variable predictora y la respuesta. Los conceptos son válidos para la regresión lineal múltiple, pero necesitaría una dimensión espacial adicional para cada predictor adicional para trazar los resultados. Eso es difícil de mostrar con la tecnología de hoy!

¿cómo interpreto los coeficientes de regresión para Relaciones curvilíneas y términos de interacción?,

en el ejemplo anterior, la altura es un efecto lineal; la pendiente es constante, lo que indica que el efecto también es constante a lo largo de toda la línea ajustada. Sin embargo, si su modelo requiere polinomios o términos de interacción, la interpretación es un poco menos intuitiva.

como Actualización, los Términos polinómicos modelan la curvatura en los datos, mientras que los Términos de interacción indican que el efecto de un predictor depende del valor de otro predictor.

el siguiente ejemplo utiliza un conjunto de datos que requiere un término cuadrático (cuadrado) para modelar la curvatura., En la salida a continuación, vemos que los valores de p para los Términos lineales y cuadráticos son significativos.

Las gráficas residuales (no mostradas) indican un buen ajuste, por lo que podemos proceder con la interpretación. Pero, ¿cómo interpretamos estos coeficientes? Realmente ayuda a graficarlo en una gráfica de línea ajustada.

Puede ver cómo la relación entre la configuración de la máquina y el consumo de energía varía dependiendo de dónde comience en la línea instalada. Por ejemplo, si comienza con una configuración de la máquina de 12 y aumenta la configuración en 1, esperaría que el consumo de energía disminuyera., Sin embargo, si usted comienza en 25, un aumento de 1 debería aumentar el consumo de energía. Y si tienes alrededor de 20 años, el consumo de energía no debería cambiar mucho en absoluto.

un término polinomial significativo puede hacer que la interpretación sea menos intuitiva porque el efecto de cambiar el predictor varía dependiendo del valor de ese predictor. De manera similar, un término de interacción significativo indica que el efecto del predictor varía dependiendo del valor de un predictor diferente.

tenga mucho cuidado cuando interprete un modelo de regresión que contenga estos tipos de términos., ¡No puedes simplemente mirar el efecto principal (término Lineal) y entender lo que está sucediendo! Desafortunadamente, si está realizando un análisis de regresión múltiple, no podrá usar un gráfico de línea ajustado para interpretar gráficamente los resultados. ¡Aquí es donde el conocimiento del área temática es extra valioso!

los lectores particularmente atentos pueden haber notado que no te dije cómo interpretar la constante. Voy a cubrir que en mi próximo post!,

asegúrese de:

Compruebe sus gráficos residuales para que pueda confiar en los resultados
Evaluar la bondad de ajuste y R-cuadrado

Si está aprendiendo sobre regresión, lea mi tutorial de regresión!

¿cómo interpreto los valores de P en el análisis de regresión lineal?,

¿cómo interpreto los coeficientes de regresión para las relaciones lineales?,

¿cómo interpreto los coeficientes de regresión para Relaciones curvilíneas y términos de interacción?,

Deja una respuesta Cancelar la respuesta