l’analyse de régression génère une équation pour décrire la relation statistique entre une ou plusieurs variables prédictives et la variable de réponse. Après avoir utilisé le logiciel statistique Minitab pour ajuster un modèle de régression et vérifié l’ajustement en vérifiant les tracés résiduels, vous voudrez interpréter les résultats. Dans cet article, je vais vous montrer comment interpréter les valeurs p et les coefficients qui apparaissent dans la sortie pour l’analyse de régression linéaire.
comment interpréter les valeurs P dans L’analyse de régression linéaire?,
la valeur p de chaque terme teste l’hypothèse nulle selon laquelle le coefficient est égal à zéro (sans effet). Une valeur p faible (< 0.05) indique que vous pouvez rejeter l’hypothèse nulle. En d’autres termes, un prédicteur qui a une faible valeur p est susceptible d’être un ajout significatif à votre modèle car les changements dans la valeur du prédicteur sont liés aux changements dans la variable de réponse.
inversement, une valeur p plus importante (insignifiante) suggère que les changements dans le prédicteur ne sont pas associés aux changements dans la réponse.,
dans la sortie ci-dessous, nous pouvons voir que les variables prédictives du Sud et du Nord sont significatives parce que leurs deux valeurs p sont 0,000. Cependant, la valeur p Pour East (0,092) est supérieure au niveau alpha commun de 0,05, ce qui indique qu’elle n’est pas statistiquement significative.
En règle générale, vous utilisez les valeurs du coefficient p pour déterminer les termes à conserver dans le modèle de régression. Dans le modèle ci-dessus, nous devrions envisager de supprimer East.
Related: f-test of overall significance
comment interpréter les Coefficients de régression pour les relations linéaires?,
Les coefficients de régression représentent la variation moyenne de la variable de réponse pour une unité de variation de la variable prédictive tout en maintenant les autres prédicteurs dans le modèle constants. Ce contrôle statistique fourni par la régression est important car il isole le rôle d’une variable de toutes les autres dans le modèle.
la clé pour comprendre les coefficients est de les considérer comme des pentes, et ils sont souvent appelés coefficients de pente. Je vais illustrer cela dans le tracé de Ligne ajusté ci-dessous, où je vais utiliser la taille d’une personne pour modéliser son poids., Tout d’abord, sortie de la fenêtre de session de Minitab:
Le tracé de Ligne ajusté affiche graphiquement les mêmes résultats de régression.
l’équation montre que le coefficient de hauteur en mètres est de 106,5 kilogrammes. Le coefficient indique que pour chaque mètre de hauteur, vous pouvez vous attendre poids augmenter en moyenne de 106.5 kg.
la ligne bleue ajustée affiche graphiquement les mêmes informations. Si vous vous déplacez à gauche ou à droite le long de l’axe des x d’une quantité qui représente un changement d’un mètre de hauteur, la ligne ajustée augmente ou diminue de 106,5 kilogrammes., Cependant, ces hauteurs proviennent de filles d’âge moyen et vont de 1,3 m à 1,7 M. La relation n’est valable que dans cette plage de données, nous ne décalerions donc pas la ligne d’un mètre complet dans ce cas.
Si la ligne ajustée était plate (un coefficient de pente de zéro), la valeur attendue pour le poids ne changerait pas, peu importe la distance de haut en bas de la ligne. Ainsi, une faible valeur p suggère que la pente n’est pas nulle, ce qui suggère à son tour que les changements dans la variable prédictive sont associés à des changements dans la variable de réponse.,
j’ai utilisé un tracé de Ligne ajusté car il donne vraiment vie aux mathématiques. Cependant, les tracés linéaires ajustés ne peuvent afficher que les résultats de la régression simple, qui est une variable prédictive et la réponse. Les concepts vrai pour la régression linéaire multiple, mais j’aurais besoin d’une dimension supplémentaire d’espace supplémentaire pour chaque prédicteur pour tracer les résultats. C’est difficile à montrer avec la technologie d’aujourd’hui!
comment interpréter les Coefficients de régression pour les relations curvilignes et les Termes D’Interaction?,
dans l’exemple ci-dessus, la hauteur est un effet linéaire; la pente est constante, ce qui indique que l’effet est également constant sur toute la ligne ajustée. Cependant, si votre modèle nécessite des termes polynomiaux ou d’interaction, l’interprétation est un peu moins intuitive.
en guise de rappel, les Termes polynomiaux modélisent la courbure dans les données, tandis que les Termes d’interaction indiquent que l’effet d’un prédicteur dépend de la valeur d’un autre prédicteur.
l’exemple suivant utilise un ensemble de données qui nécessite un terme quadratique (carré) pour modéliser la courbure., Dans la sortie ci-dessous, nous voyons que les valeurs p pour les Termes linéaires et quadratiques sont significatives.
Les tracés résiduels (non représentés) indiquent un bon ajustement, nous pouvons donc procéder à l’interprétation. Mais, comment interpréter ces coefficients? Cela aide vraiment à le représenter graphiquement dans un tracé de Ligne ajusté.
Vous pouvez voir comment la relation entre le réglage de la machine et la consommation d’énergie varie en fonction de l’endroit où vous commencez sur la ligne montée. Par exemple, si vous démarrez à un réglage machine de 12 et augmentez le réglage de 1, vous vous attendez à ce que la consommation d’énergie diminue., Toutefois, si vous commencez à 25 ans, une augmentation de 1 devrait augmenter la consommation d’énergie. Et si vous avez environ 20 ans, la consommation d’énergie ne devrait pas beaucoup changer.
un terme polynomial significatif peut rendre l’interprétation moins intuitive car l’effet de changer le prédicteur varie en fonction de la valeur de ce prédicteur. De même, un terme d’interaction significatif indique que l’effet du prédicteur varie en fonction de la valeur d’un prédicteur différent.
Faites très attention lorsque vous interprétez un modèle de régression qui contient ces types de termes., Vous ne pouvez pas simplement regarder l’effet principal (terme linéaire) et comprendre ce qui se passe! Malheureusement, si vous effectuez une analyse de régression multiple, vous ne pourrez pas utiliser un tracé linéaire ajusté pour interpréter graphiquement les résultats. C’est là que la connaissance du domaine est très précieuse!
les lecteurs particulièrement attentifs ont peut-être remarqué que je ne vous ai pas dit comment interpréter la constante. Je vais couvrir cela dans mon prochain post!,
assurez-vous de:
- Vérifiez vos tracés résiduels afin de pouvoir faire confiance aux résultats
- évaluez la qualité de l’ajustement et le R carré
Si vous apprenez la régression, lisez mon tutoriel de régression!