Miután az épület egy gépi tanulási modell, a következő lépés az, hogy értékelje a modell teljesítmény megérteni, hogy milyen jó a modell ellen egy referencia modell., A használni kívánt értékelési mutató attól függ, hogy milyen típusú problémát próbál megoldani – legyen az felügyelt vagy felügyelet nélküli probléma, valamint osztályozási vagy regressziós feladat.
ebben a bejegyzésben a regressziós problémákhoz használt két fontos értékelési mutatóról fogok beszélni, kiemelve a köztük lévő legfontosabb különbséget.
R-négyzet, más néven együttható meghatározása, meghatározza, hogy milyen mértékben a variancia a függő változó (vagy cél) magyarázható a független változó (jellemzők).,
értsük meg ezt egy példával-mondjuk egy adott modell r-négyzetének értéke 0, 7. Ez azt jelenti, hogy a függő változó változásának 70% – át a független változók magyarázzák.
ideális esetben azt szeretnénk, ha a független változók képesek lennének megmagyarázni a célváltozó összes változását. Ebben a forgatókönyvben az r-négyzet értéke 1 lenne. Így azt mondhatjuk, hogy magasabb az r-négyzet értéke, jobb a modellben.,
tehát, egyszerű szavakkal, magasabb az R négyzet, annál több variációt magyaráznak a bemeneti változók, ezért jobb a modell. Továbbá, az r-négyzet 0-tól 1-ig terjedne. Itt a képlet R-négyzet-
A R-squared által kiszámított összeget elosztjuk a négyzetek a nyereségből a regressziós modell (adott SSres) által teljes összege négyzetek hibák az átlagos modell (adott SStot), majd vonjuk ki az 1-jétől.,