analiza de regresie generează o ecuație pentru a descrie relația statistică dintre una sau mai multe variabile predictoare și variabila de răspuns. După ce utilizați software-ul statistic Minitab pentru a se potrivi unui model de regresie și verificați potrivirea verificând parcelele reziduale, veți dori să interpretați rezultatele. În acest post, vă voi arăta cum să interpretați valorile p și coeficienții care apar în ieșire pentru analiza regresiei liniare.
cum interpretez valorile P în analiza regresiei liniare?,
valoarea p pentru fiecare termen testează ipoteza nulă că coeficientul este egal cu zero (fără efect). O valoare p scăzută (< 0.05) indică faptul că puteți respinge ipoteza nulă. Cu alte cuvinte, un predictor care are o valoare p scăzută este probabil să fie un plus semnificativ pentru modelul dvs., deoarece modificările valorii predictorului sunt legate de modificările variabilei de răspuns.în schimb, o valoare p mai mare (nesemnificativă) sugerează că modificările predictorului nu sunt asociate cu modificări ale răspunsului.,
în rezultatul de mai jos, putem vedea că variabilele predictoare ale Sudului și Nordului sunt semnificative, deoarece ambele valori p sunt 0.000. Cu toate acestea, valoarea p Pentru Est (0,092) este mai mare decât nivelul alfa comun de 0,05, ceea ce indică faptul că nu este semnificativ statistic.
De obicei, utilizați coeficientul p-valori pentru a determina ce termeni să păstreze în modelul de regresie. În modelul de mai sus, ar trebui să luăm în considerare eliminarea Estului.
înrudit: F-test de semnificație generală
cum interpretez coeficienții de regresie pentru relațiile liniare?,
coeficienții de regresie reprezintă modificarea medie a variabilei de răspuns pentru o unitate de modificare a variabilei predictor în timp ce dețin alți predictori în Constanta modelului. Acest control statistic pe care îl oferă regresia este important deoarece izolează rolul unei variabile de toate celelalte din model.
cheia înțelegerii coeficienților este să ne gândim la ei ca pante, și ei sunt adesea numiți coeficienți de pantă. Voi ilustra acest lucru în graficul liniei montate de mai jos, unde voi folosi înălțimea unei persoane pentru a-și modela greutatea., În primul rând, ieșirea ferestrei sesiunii Minitab:
graficul liniei montate arată grafic aceleași rezultate de regresie.ecuația arată că coeficientul pentru înălțimea în metri este de 106,5 kilograme. Coeficientul indică faptul că pentru fiecare metru suplimentar în înălțime vă puteți aștepta ca greutatea să crească cu o medie de 106,5 kilograme.
linia albastră montată arată grafic aceleași informații. Dacă vă deplasați la stânga sau la dreapta de-a lungul axei x cu o sumă care reprezintă o schimbare de înălțime de un metru, linia montată crește sau scade cu 106, 5 kilograme., Cu toate acestea, aceste înălțimi sunt de la fete de vârstă mijlocie și variază de la 1, 3 m la 1, 7 m. relația este valabilă doar în acest interval de date, așa că nu am schimba efectiv în sus sau în jos linia cu un metru complet în acest caz.
În cazul în care linia montat a fost plat (un coeficient de pantă de zero), valoarea așteptată pentru greutate nu s-ar schimba indiferent de cât de departe în sus și în jos linia te duci. Deci, o valoare p scăzută sugerează că panta nu este zero, ceea ce la rândul său sugerează că modificările variabilei predictor sunt asociate cu modificări ale variabilei de răspuns.,
am folosit un complot linie montat, deoarece aduce într-adevăr matematica la viață. Cu toate acestea, parcele de linie montate pot afișa doar rezultatele de la regresie simplă, care este o variabilă predictor și răspunsul. Conceptele sunt adevărate pentru regresia liniară multiplă, dar aș avea nevoie de o dimensiune spațială suplimentară pentru fiecare predictor suplimentar pentru a trasa rezultatele. Acest lucru este greu de arătat cu tehnologia de astăzi!
cum interpretez coeficienții de regresie pentru relațiile curbilinii și Termenii de interacțiune?,
în exemplul de mai sus, înălțimea este un efect liniar; panta este constantă, ceea ce indică faptul că efectul este, de asemenea, constant de-a lungul întregii linii montate. Cu toate acestea, dacă modelul dvs. necesită Termeni polinomiali sau de interacțiune, interpretarea este puțin mai puțin intuitivă.
ca o reîmprospătare, Termeni polinomiale model de curbură în date, în timp ce termenii de interacțiune indică faptul că efectul unui predictor depinde de valoarea unui alt predictor.
următorul exemplu utilizează un set de date care necesită un termen pătratic (pătrat) pentru a modela curbura., În rezultatul de mai jos, vedem că valorile p atât pentru termenii liniari, cât și pentru cei pătratici sunt semnificative.
parcelele reziduale (nu sunt prezentate) indică o potrivire bună, astfel încât să putem continua interpretarea. Dar, cum interpretăm acești coeficienți? Este într-adevăr ajută să-l grafic într-un complot linie montate.puteți vedea cum relația dintre setarea mașinii și consumul de energie variază în funcție de locul în care porniți pe linia montată. De exemplu, dacă porniți de la o setare a mașinii de 12 și măriți setarea cu 1, vă așteptați ca consumul de energie să scadă., Cu toate acestea, dacă începeți la 25, o creștere de 1 ar trebui să crească consumul de energie. Și dacă aveți în jur de 20 de ani, consumul de energie nu ar trebui să se schimbe deloc.un termen polinomial semnificativ poate face interpretarea mai puțin intuitivă, deoarece efectul schimbării predictorului variază în funcție de valoarea predictorului respectiv. În mod similar, un termen semnificativ de interacțiune indică faptul că efectul predictorului variază în funcție de valoarea unui predictor diferit.aveți grijă deosebită când interpretați un model de regresie care conține aceste tipuri de termeni., Nu poți doar să te uiți la efectul principal (termen liniar) și să înțelegi ce se întâmplă! Din păcate, dacă efectuați o analiză de regresie multiplă, nu veți putea utiliza un complot de linie montat pentru a interpreta grafic rezultatele. Acest lucru este în cazul în care cunoștințele domeniu este foarte valoros!este posibil ca cititorii deosebit de atenți să fi observat că nu v-am spus cum să interpretați Constanta. Voi acoperi asta în următoarea mea postare!,
asigurați-vă că:
- verificați parcelele reziduale, astfel încât să puteți avea încredere în rezultate
- evaluați bunătatea de potrivire și R-pătrat
Dacă învățați despre regresie, citiți tutorialul meu de regresie!