Du har en modell, och nu vill du bedöma hur bra det fungerar. Hur mäter du Modell effektivitet?
det finns flera mätvärden som du kan använda för att bedöma hur bra en klassificeringsmodell är, varav de vanligaste är noggrannhet, precision och återkallelse. Noggrannhet mäter hur mycket av de data du märkt korrekt. Det vill säga noggrannhet är förhållandet det nummer som är märkt korrekt över det totala antalet. Om du försöker klassificera bara en sak (t. ex., hot dog eller inte), noggrannhet kan skrivas som(antalet sanna positiva + antalet sanna negativ)/(antal sanna positiva + antal sanna negativ + antal falska positiva + antal falska negativa). Sant positiva är exempel med en positiv etikett som du märkt som positiv, t. ex.du märkt en varmkorv som en varmkorv. På samma sätt är sanna negativ exempel med en negativ etikett som du märkt som negativ, t.ex. du märkt en katt som inte en varmkorv. Å andra sidan är falska positiva exempel som var negativa som du märkt positiva, t. ex., du märkt en katt som en varmkorv (hur kunde du!?) och på samma sätt falska negativ är exempel som var positiva att du märkt negativ, t. ex. du märkt en varmkorv som inte en varmkorv. Den sanna eller falska i sann positiv, falsk negativ, etc., anger om du märkt det korrekt eller inte, och positiv eller negativ är vad du märkt det. Så noggrannhet är bara antalet saker du korrekt märkt som positiva och negativa dividerat med det totala antalet saker du märkt., Om du försöker klassificera många saker istället för bara en, är den totala noggrannheten bara antalet saker du korrekt märkt i varje kategori dividerat med det totala antalet saker du märkt.
Precision är ett mått som berättar hur ofta att något du märker som positivt är faktiskt positivt. Mer formellt med notationen från tidigare är precision antalet sanna positiva / (antalet sanna positiva plus antalet falska positiva). Å andra sidan, recall är det mått som talar om andelen positiva Du etikett korrekt., Det vill säga återkallelse är antalet sanna positiva / (antalet sanna positiva plus antalet falska negativ). Skillnaden mellan precision och återkallelse är typ av subtil, så låt mig upprepa: precision är antalet positiva exempel du märkt korrekt över det totala antalet gånger du märkt något positivt, medan återkallelsen är antalet positiva exempel du märkt korrekt över det totala antalet saker som faktiskt var positiva. Du kan tänka på precision som andelen gånger som när du förutspår dess positiva det faktiskt visar sig vara positiv., Var som återkallelse kan ses som noggrannhet över bara positiva-det är andelen gånger du märkt positivt korrekt över antalet gånger det var faktiskt positivt.
i multi-label-fallet tillämpas precision och återkallelse vanligtvis per kategori. Det vill säga om du försöker gissa om en bild har en katt eller hund eller andra djur, skulle du få precision och återkallelse för dina katter och hundar separat., Då är det bara det binära fallet igen – om du vill ha precisionen för katter, tar du antalet gånger du gissade rätt att det var katt / det totala antalet gånger som du gissade något var en katt. På samma sätt, om du vill få minns för katter, du tar antalet gånger du gissade rätt det var en katt över det totala antalet gånger det var faktiskt en katt.