aveți un model și acum doriți să judecați cât de bine funcționează. Cum măsurați eficacitatea modelului?există mai multe valori pe care le puteți utiliza pentru a evalua cât de bun este un model de clasificare, dintre care cele mai frecvente sunt precizia, precizia și rechemarea. Precizia măsoară cantitatea de date pe care le-ați etichetat corect. Adică, precizia este raportul numărul etichetat corect față de numărul total. Dacă încercați să clasificați un singur lucru (de ex., hot dog sau nu), precizia poate fi scrisă ca (numărul de pozitive adevărate + numărul de negative adevărate)/(numărul de pozitive adevărate + numărul de negative adevărate + numărul de pozitive false + numărul de negative false). Adevăratele pozitive sunt exemple cu o etichetă pozitivă pe care ați etichetat-o ca fiind pozitivă, de exemplu, ați etichetat un hot dog ca un hot dog. În mod similar, adevăratele negative sunt exemple cu o etichetă negativă pe care ați etichetat-o ca fiind negativă, de exemplu, ați etichetat o pisică ca nu un hot dog. Pe de altă parte, falsele pozitive sunt exemple negative pe care le-ați etichetat pozitive, de ex., ai etichetat o pisică ca un hot dog (cum ai putut!?) și, în mod similar, falsele negative sunt exemple care au fost pozitive pe care le-ați etichetat negativ, de exemplu, ați etichetat un hot dog ca nu un hot dog. Adevărat sau fals în adevărat pozitiv, fals negativ etc., indică dacă l-ați etichetat corect sau nu, iar pozitiv sau negativ este ceea ce l-ați etichetat. Deci precizia este doar numărul de lucruri pe care le-ați etichetat corect ca pozitive și negative împărțit la numărul total de lucruri pe care le-ați etichetat., În cazul în care încercați să clasificați o mulțime de lucruri în loc de unul singur, precizia generală este doar numărul de lucruri pe care le-ați etichetat corect în fiecare categorie împărțit la numărul total de lucruri pe care le-ați etichetat.
precizia este o măsură care vă spune cât de des acel lucru pe care îl etichetați ca pozitiv este de fapt pozitiv. Mai formal folosind notația de mai devreme, precizia este numărul de pozitive reale/ (Numărul de pozitive reale plus numărul de pozitive false). Pe de altă parte, rechemarea este măsura care vă spune procentul de pozitive pe care le etichetați corect., Adică, rechemarea este numărul de pozitive adevărate/(numărul de pozitive adevărate plus numărul de negative false). Diferența între precizia și recall-ul este destul de subtil, așa că permiteți-mi să reiterez: precizie este numărul de exemple pozitive-ai etichetat corect peste numărul total de ori etichetat ceva pozitiv, întrucât amintesc este numărul de exemple pozitive-ai etichetat corect peste numărul total de lucruri care de fapt au fost pozitive. Vă puteți gândi de precizie ca proporția de ori că, atunci când prezice sale pozitive de fapt se dovedește a fi pozitiv., În cazul în care ca rechemare poate fi considerat ca precizie peste doar pozitive – este proporția de ori ați etichetat pozitiv corect peste suma de ori a fost de fapt pozitiv.
în cazul multi-etichetă, precizie și rechemare sunt de obicei aplicate pe o bază pe categorie. Adică, dacă încercați să ghiciți dacă o imagine are o pisică sau un câine sau alte animale, veți obține precizie și rechemare pentru pisicile și câinii dvs. separat., Apoi este doar cazul binar din nou – dacă doriți precizia pentru pisici, luați de câte ori ați ghicit corect că a fost pisică / numărul total de ori că ați ghicit că ceva a fost o pisică. În mod similar, dacă doriți să obțineți rechemare pentru pisici, luați de câte ori ați ghicit corect că a fost o pisică peste numărul total de ori a fost de fapt o pisică.