R-Squared vs Adjusted R-Squared (Suomi)

R-Squared vs Adjusted R-Squared (Suomi)

Aishwarya Singh

Seuraa

Aug 23, 2019 · 3 min lue

Kun rakennuksen kone oppimisen malli, seuraava askel on arvioida mallin toimivuutta ja ymmärtää, miten hyvä meidän malli on vastaan benchmark-malli., Arviointi metrinen käytetään riippuu tyyppinen ongelma yritetään ratkaista —onko se on valvottu tai ilman valvontaa ongelma, ja jos kyseessä on luokitus-tai regressio tehtävä.

tässä viestissä aion puhua kahdesta tärkeästä regressio-ongelmiin käytetystä arviointimittarista ja korostaa niiden keskeistä eroa.

T-neliö, joka tunnetaan myös nimellä kertoimen määrittäminen, määritellään, missä määrin varianssi riippuva muuttuja (tai kohde) voidaan selittää sillä, että riippumaton muuttuja (ominaisuudet).,

Anna meidän ymmärtää tämän esimerkin sanoa R-squared arvo tietyn mallin tulee ulos on 0.7. Tämä tarkoittaa, että 70 prosenttia riippuvaisen muuttujan vaihtelusta selittyy riippumattomilla muuttujilla.

ihanteellista olisi, että riippumattomat muuttujat pystyisivät selittämään kaikki kohdemuuttujan vaihtelu. Siinä skenaariossa R-neliöarvo olisi 1. Näin voimme sanoa, että korkeampi R-neliöarvo, parempi mallissa.,

Niin, yksinkertaistettuna, korkeampi korrelaatiokerroin on, sitä enemmän vaihtelu selittyy tulo muuttujia, ja näin ollen parempi on teidän malli. Myös R-neliö olisi 0-1. Täällä on laskentakaava R-squared-

R-squared lasketaan jakamalla summa neliöiden jäännökset alkaen regressiomallin (antama SSres) mukaan yhteensä neliöiden summa virheet keskiarvon malli (antama SStot) ja sitten vähennä 1.,

Yksi haittapuoli r-squared on, että se olettaa jokaisen muuttujan auttaa selittämään muutoksen kohde, joka ei ehkä aina ole totta. Esimerkiksi, jos me lisätä uusia ominaisuuksia koskevat tiedot (jotka voidaan tai ei olla hyödyllinen), r-squared value malli olisi joko kasvaa tai pysyy samana, mutta se ei koskaan pienene.

Tämä on hoitaa hieman muunneltu versio r-squared, nimeltään adjusted r-squared.,

Adjusted R-squared

Vastaavia R-squared, Oikaistu R-squared toimenpiteitä vaihtelun riippuvan muuttujan (tai kohde), selittyy vain ominaisuudet, jotka ovat hyödyllistä tehdä ennustuksia. Toisin kuin R-neliö, oikaistu R-neliö rangaistaan lisäämällä ominaisuuksia, jotka eivät ole hyödyllisiä ennustaa kohde.

Anna meille matemaattisesti ymmärtää, miten tämä ominaisuus on saatavilla Adjusted R-Squared., Tässä on kaava adjusted r-squared

Tässä R^2 on r-squared lasketaan, N on rivien lukumäärä ja M sarakkeiden lukumäärä. Ominaisuuden määrän kasvaessa nimittäjän arvo laskee.

  • Jos R2 kasvaa merkittävällä arvolla, niin korjattu R-neliö kasvaa.
  • Jos R2: ssa ei tapahdu merkittävää muutosta, korjattu r2 pienenisi.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *