Die Regressionsanalyse generiert eine Gleichung zur Beschreibung der statistischen Beziehung zwischen einer oder mehreren Prädiktorvariablen und der Antwortvariablen. Nachdem Sie die statistische Minitab-Software zum Anpassen eines Regressionsmodells verwendet und die Anpassung durch Überprüfen der Restdiagramme überprüft haben, sollten Sie die Ergebnisse interpretieren. In diesem Beitrag zeige ich Ihnen, wie Sie die p-Werte und Koeffizienten interpretieren, die in der Ausgabe für die lineare Regressionsanalyse angezeigt werden.
Wie interpretiere ich die P-Werte in der linearen Regressionsanalyse?,
Der p-Wert für jeden Term testet die Nullhypothese, dass der Koeffizient gleich Null ist (keine Wirkung). Ein niedriger p-Wert (< 0.05) zeigt an, dass Sie die Nullhypothese ablehnen können. Mit anderen Worten, ein Prädiktor mit einem niedrigen p-Wert ist wahrscheinlich eine sinnvolle Ergänzung zu Ihrem Modell, da Änderungen im Wert des Prädiktors mit Änderungen in der Antwortvariablen zusammenhängen.
Umgekehrt deutet ein größerer (unbedeutender) p-Wert darauf hin, dass Änderungen im Prädiktor nicht mit Änderungen in der Antwort verbunden sind.,
In der Ausgabe unten können wir sehen, dass die Prädiktorvariablen von Süd und Nord signifikant sind, da beide p-Werte 0,000 sind. Der p-Wert für East (0.092) ist jedoch größer als der übliche Alpha-Wert von 0.05, was darauf hinweist, dass er statistisch nicht signifikant ist.
Normalerweise verwenden Sie den Koeffizienten p-Werte, um zu bestimmen, welche Begriffe in dem Regressionsmodell zu halten. Im obigen Modell sollten wir in Betracht ziehen, Osten zu entfernen.
Related: F-test of overall significance
Wie interpretiere ich die Regressionskoeffizienten für lineare Beziehungen?,
Regressionskoeffizienten stellen die mittlere Änderung der Antwortvariablen für eine Änderungseinheit der Prädiktorvariablen dar, während andere Prädiktoren im Modell konstant gehalten werden. Diese statistische Kontrolle, die die Regression bietet, ist wichtig, da sie die Rolle einer Variablen von allen anderen im Modell isoliert.
Der Schlüssel zum Verständnis der Koeffizienten besteht darin, sie als Steigungen zu betrachten, und sie werden oft als Steigungskoeffizienten bezeichnet. Ich werde dies im folgenden angepassten Liniendiagramm veranschaulichen, in dem ich die Größe einer Person verwende, um ihr Gewicht zu modellieren., Zuerst wird das Sitzungsfenster von Minitab ausgegeben:
Das angepasste Liniendiagramm zeigt die gleichen Regressionsergebnisse grafisch an.
Die Gleichung zeigt, dass der Koeffizient für die Höhe in Metern ist 106.5 Kilogramm. Der Koeffizient gibt an, dass Sie für jeden zusätzlichen Höhenmeter mit einer Gewichtszunahme von durchschnittlich 106, 5 Kilogramm rechnen können.
Die blaue angepasste Linie zeigt grafisch die gleichen Informationen. Wenn Sie sich entlang der x-Achse um einen Betrag nach links oder rechts bewegen, der eine Höhenänderung von einem Meter darstellt, steigt oder fällt die angepasste Linie um 106, 5 Kilogramm., Diese Höhen stammen jedoch von Mädchen im mittleren Schulalter und reichen von 1, 3 m bis 1, 7 m. Die Beziehung ist nur innerhalb dieses Datenbereichs gültig, sodass wir uns in diesem Fall nicht um einen vollen Meter nach oben oder unten bewegen würden.
Wenn die angepasste Linie flach wäre (ein Neigungskoeffizient von Null), würde sich der erwartete Wert für das Gewicht nicht ändern, egal wie weit Sie die Linie nach oben und unten gehen. Ein niedriger p-Wert deutet also darauf hin, dass die Steigung nicht Null ist, was wiederum darauf hindeutet, dass Änderungen in der Prädiktorvariablen mit Änderungen in der Antwortvariablen verbunden sind.,
Ich habe ein angepasstes Liniendiagramm verwendet, weil es die Mathematik wirklich zum Leben erweckt. Angepasste Liniendiagramme können jedoch nur die Ergebnisse einer einfachen Regression anzeigen, bei der es sich um eine Prädiktorvariable und die Antwort handelt. Die Konzepte gelten für mehrere lineare Regressionen, aber ich würde für jeden zusätzlichen Prädiktor eine zusätzliche räumliche Dimension benötigen, um die Ergebnisse zu zeichnen. Das ist mit der heutigen Technologie schwer zu zeigen!
Wie interpretiere ich die Regressionskoeffizienten für krummlinige Beziehungen und Interaktionsterme?,
Im obigen Beispiel ist Höhe ein linearer Effekt; Die Steigung ist konstant, was anzeigt, dass der Effekt auch entlang der gesamten angepassten Linie konstant ist. Wenn Ihr Modell jedoch Polynom-oder Interaktionsbegriffe erfordert, ist die Interpretation etwas weniger intuitiv.
Als Auffrischung modellieren Polynombegriffe die Krümmung in den Daten, während Interaktionsterme anzeigen, dass die Wirkung eines Prädiktors vom Wert eines anderen Prädiktors abhängt.
Im nächsten Beispiel wird ein Datensatz verwendet, der einen quadratischen (quadratischen) Term benötigt, um die Krümmung zu modellieren., In der Ausgabe unten sehen wir, dass die p-Werte sowohl für lineare als auch für quadratische Terme signifikant sind.
Die verbleibenden Diagramme (nicht gezeigt) zeigen eine gute Passform an, sodass wir mit der Interpretation fortfahren können. Aber wie interpretieren wir diese Koeffizienten? Es hilft wirklich, es in einem angepassten Liniendiagramm darzustellen.
Sie können sehen, wie die Beziehung zwischen der Maschineneinstellung und dem Energieverbrauch variiert, je nachdem, wo Sie auf der angepassten Linie beginnen. Wenn Sie beispielsweise bei einer Maschineneinstellung von 12 beginnen und die Einstellung um 1 erhöhen, erwarten Sie, dass der Energieverbrauch sinkt., Wenn Sie jedoch bei 25 beginnen, sollte eine Erhöhung von 1 den Energieverbrauch erhöhen. Und wenn Sie um 20 sind, sollte sich der Energieverbrauch überhaupt nicht ändern.
Ein signifikanter Polynomterm kann die Interpretation weniger intuitiv machen, da der Effekt der Änderung des Prädiktors abhängig vom Wert dieses Prädiktors variiert. In ähnlicher Weise zeigt ein signifikanter Interaktionsterm an, dass die Wirkung des Prädiktors in Abhängigkeit vom Wert eines anderen Prädiktors variiert.
Achten Sie besonders darauf, wenn Sie ein Regressionsmodell interpretieren, das diese Arten von Begriffen enthält., Sie können nicht nur den Haupteffekt (linearer Begriff) betrachten und verstehen, was passiert! Wenn Sie mehrere Regressionsanalysen durchführen, können Sie leider kein angepasstes Liniendiagramm verwenden, um die Ergebnisse grafisch zu interpretieren. Hier ist Fachwissen besonders wertvoll!
Besonders aufmerksame Leser haben vielleicht bemerkt, dass ich Ihnen nicht gesagt habe, wie Sie die Konstante interpretieren sollen. Ich werde das in meinem nächsten Beitrag behandeln!,
Achten Sie darauf:
- Überprüfen Sie Ihre Restdiagramme, damit Sie den Ergebnissen vertrauen können
- Bewerten Sie die Passgenauigkeit und das R-Quadrat
Wenn Sie etwas über Regression lernen, lesen Sie mein Regressions-Tutorial!