máte model, a nyní chcete posoudit, jak dobře to hraje. Jak změříte účinnost modelu?
existuje několik metrik, které byste mohli použít k posouzení, jak dobrý je klasifikační model, z nichž nejčastější jsou přesnost, přesnost a odvolání. Přesnost měří, kolik dat jste správně označili. To znamená, že přesnost je poměr číslo správně označené nad celkovým počtem. Pokud se snažíte klasifikovat jen jednu věc (např., hot dog nebo ne), přesnost může být zapsáno jako (počet pravda pozitivních + počet pravda, negativy)/(počet pravda pozitivních + počet pravda negativních + počet falešně pozitivních + počet falešně negativních). Pravdivá pozitiva jsou příklady s pozitivním štítkem, který jste označili jako pozitivní, např. jste označili hot dog jako hot dog. Podobně pravdivé negativy jsou příklady s negativním štítkem, který jste označili jako negativní, např. Na druhou stranu, falešná pozitiva jsou příklady, které byly negativní, které jste označili za pozitivní, např., označili jste kočku jako hot dog(jak byste mohli!?) a podobně falešná negativa jsou příklady, které byly pozitivní, že jste označili negativní, např. jste označili hot dog jako ne hot dog. Pravda nebo nepravda v pravém pozitivním, falešně negativním atd., označuje, zda jste ji správně označili nebo ne, a pozitivní nebo negativní je to, co jste ji označili. Přesnost je tedy jen počet věcí, které jste správně označili jako pozitivní a negativní děleno celkovým počtem věcí, které jste označili., V případě, že se snažíte klasifikovat spoustu věcí místo jednoho, celková přesnost je jen počet věcí, které jste správně označili v každé kategorii děleno celkovým počtem věcí, které jste označili.
přesnost je opatření, které vám řekne, jak často je něco, co označíte jako pozitivní, skutečně pozitivní. Více formálně pomocí notace z dřívějška, přesnost je počet skutečných pozitiv/ (počet skutečných pozitivních plus počet falešných pozitiv). Na druhou stranu, odvolání je opatření, které vám řekne procento pozitiv, které správně označíte., To znamená, že odvolání je počet skutečných pozitiv/(počet skutečných pozitiv plus počet falešných negativů). Rozdíl mezi precision a recall je docela jemné, takže dovolte mi zopakovat: přesnost je počet pozitivních příkladů je označen správně více než celkový počet, kolikrát jste označen něco pozitivního, vzhledem k tomu, že odvolání je počet pozitivních příkladů je označen správně na celkovém počtu věcí, které byly ve skutečnosti pozitivní. Můžete myslet na přesnost jako na poměr časů, kdy když předpovídáte její pozitivní, ukáže se, že je pozitivní., Kde jako odvolání může být myšlenka jako přesnost více než jen pozitiva – to je poměr, kolikrát je označen pozitivní správně přes množství časů to bylo vlastně pozitivní.
v případě více štítků se přesnost a vyvolání obvykle používají na základě jednotlivých kategorií. To znamená, že pokud se snažíte odhadnout, zda má obrázek kočku nebo psa nebo jiná zvířata, dostanete přesnost a vzpomínáte na své kočky a psy zvlášť., Pak je to opět jen binární případ-pokud chcete přesnost pro kočky, vezmete si kolikrát jste správně uhodli, že to byla kočka / celkový počet případů, kdy jste uhodli, že něco je kočka. Podobně, pokud chcete získat odvolání pro kočky, budete mít kolikrát jste uhodli správně to byla kočka nad celkovým počtem časů to byla vlastně kočka.