du har en model, og nu vil du bedømme, hvor godt den fungerer. Hvordan måler du modeleffektivitet?
Der er flere målinger, du kan bruge til at bedømme, hvor god en klassifikationsmodel er, hvoraf den mest almindelige er nøjagtighed, præcision og tilbagekaldelse. Nøjagtighed måler, hvor meget af de data, du mærket korrekt. Det vil sige, nøjagtighed er forholdet tallet mærket korrekt over det samlede antal. Hvis du forsøger at klassificere kun (n ting (f. eks, hotdog eller ej), nøjagtighed kan skrives som (antallet af sande positiver + antallet af sande negativer)/(antal sande positiver + antal sande negativer + antal falske positiver + antal falske negativer). Sande positive er eksempler med en positiv etiket, som du mærket som positiv, f.du mærket en hotdog som en hotdog. Tilsvarende er ægte negativer eksempler med en negativ etiket, som du mærkede som negativ, f.eks. På den anden side er falske positiver eksempler, der var negative, som du mærkede positivt, f. eks., du mærkede en kat som en hotdog (hvordan kunne du!?) og lignende falske negativer er eksempler, der var positive, at du mærkede negativt, f.eks. Den sande eller falske i Sand positiv, falsk negativ, etc., angiver, om du har mærket det korrekt eller ej, og positivt eller negativt er det, du har mærket det. Så nøjagtighed er bare antallet af ting, du korrekt mærket som positiv og negativ divideret med det samlede antal ting, du mærket., I det tilfælde, hvor du forsøger at klassificere en masse ting i stedet for kun onen, den samlede nøjagtighed er bare antallet af ting, du korrekt mærket i hver kategori divideret med det samlede antal ting, du mærket.
præcision er et mål, der fortæller dig, hvor ofte det, du mærker som positivt, faktisk er positivt. Mere formelt ved hjælp af notationen fra tidligere er præcision antallet af sande positive / (antallet af sande positive plus antallet af falske positive). På den anden side er tilbagekaldelse den foranstaltning, der fortæller dig den procentdel af positive, du mærker korrekt., Det vil sige, tilbagekaldelse er antallet af sande positive/(antallet af sande positive plus antallet af falske negativer). Forskellen mellem præcision og tilbagekaldelse er slags subtil, så lad mig gentage: præcision er antallet af positive eksempler, du mærkede korrekt over det samlede antal gange, du mærkede noget positivt, hvorimod tilbagekaldelse er antallet af positive eksempler, du mærkede korrekt over det samlede antal ting, der faktisk var positive. Du kan tænke på præcision som andelen af gange, når du forudsiger sin positive det faktisk viser sig at være positiv., Hvor som tilbagekaldelse kan betragtes som nøjagtighed over bare positiverne-det er andelen af gange, du mærkede positivt korrekt over mængden af gange, det faktisk var positivt.
i multi-label-sagen anvendes præcision og tilbagekaldelse normalt pr. Det vil sige, hvis du forsøger at gætte, om et billede har en kat eller hund eller andre dyr, vil du få præcision og huske for dine katte og hunde separat., Så er det bare den binære sag igen – hvis du vil have præcisionen for katte, tager du det antal gange, du gættede korrekt, at det var kat / det samlede antal gange, du gættede noget, var en kat. Tilsvarende, hvis du ønsker at få tilbagekaldelse for katte, du tager det antal gange, du gættede korrekt, det var en kat over det samlede antal gange, det var faktisk en kat.