
Miután az épület egy gépi tanulási modell, a következő lépés az, hogy értékelje a modell teljesítmény megérteni, hogy milyen jó a modell ellen egy referencia modell., A használni kívánt értékelési mutató attól függ, hogy milyen típusú problémát próbál megoldani – legyen az felügyelt vagy felügyelet nélküli probléma, valamint osztályozási vagy regressziós feladat.
ebben a bejegyzésben a regressziós problémákhoz használt két fontos értékelési mutatóról fogok beszélni, kiemelve a köztük lévő legfontosabb különbséget.
R-négyzet, más néven együttható meghatározása, meghatározza, hogy milyen mértékben a variancia a függő változó (vagy cél) magyarázható a független változó (jellemzők).,
értsük meg ezt egy példával-mondjuk egy adott modell r-négyzetének értéke 0, 7. Ez azt jelenti, hogy a függő változó változásának 70% – át a független változók magyarázzák.
ideális esetben azt szeretnénk, ha a független változók képesek lennének megmagyarázni a célváltozó összes változását. Ebben a forgatókönyvben az r-négyzet értéke 1 lenne. Így azt mondhatjuk, hogy magasabb az r-négyzet értéke, jobb a modellben.,
tehát, egyszerű szavakkal, magasabb az R négyzet, annál több variációt magyaráznak a bemeneti változók, ezért jobb a modell. Továbbá, az r-négyzet 0-tól 1-ig terjedne. Itt a képlet R-négyzet-
A R-squared által kiszámított összeget elosztjuk a négyzetek a nyereségből a regressziós modell (adott SSres) által teljes összege négyzetek hibák az átlagos modell (adott SStot), majd vonjuk ki az 1-jétől.,

/ div >
az R-négyzet egyik hátránya, hogy feltételezi, hogy minden változó segít a cél változásának magyarázatában, ami nem mindig igaz. Például, ha új funkciókat adunk az adatokhoz (amelyek hasznosak lehetnek vagy nem hasznosak), akkor a modell r-négyzetének értéke növekszik vagy változatlan marad, de soha nem csökken.
ezt az R-négyzet kissé módosított változata gondoskodik,az úgynevezett korrigált r-négyzet.,
Korrigált R-négyzet
az R-négyzethez hasonlóan a korrigált R-négyzet a függő változó (vagy cél) változását méri, amelyet csak az előrejelzések készítésében hasznos funkciók magyaráznak. Az R-négyzettől eltérően a korrigált R-négyzet büntetné Önt olyan funkciók hozzáadásához, amelyek nem hasznosak a cél előrejelzéséhez.
nézzük matematikailag megérteni, hogy ez a funkció elhelyezésére Korrigált R-négyzet., Itt van a módosított R-négyzet képlete

itt r^2 az R-négyzet, n a sorok száma, M pedig az oszlopok száma. Ahogy a funkciók száma nő, a nevező értéke csökken.
- ha az R2 jelentős értékkel nő, akkor a korrigált r-négyzet növekedni fog.
- ha nincs jelentős változás az R2-ben, akkor a korrigált r2 csökken.