Intuïtie: Wat is nauwkeurigheid, precisie en herinnering in machine learning, en hoe werken ze? / Sentim

Intuïtie: Wat is nauwkeurigheid, precisie en herinnering in machine learning, en hoe werken ze? / Sentim

je hebt een model, en nu wil je beoordelen hoe goed het presteert. Hoe meet u de effectiviteit van het model?

Er zijn verschillende metrics die u kunt gebruiken om te beoordelen hoe goed een Classificatiemodel is, waarvan de meest voorkomende nauwkeurigheid, precisie en recall zijn. Nauwkeurigheid meet hoeveel van de gegevens u correct hebt gelabeld. Dat wil zeggen, nauwkeurigheid is de verhouding van het aantal correct geëtiketteerd over het totale aantal. Als u slechts één ding probeert te classificeren (bijv., hotdog of niet), nauwkeurigheid kan worden geschreven als (het aantal echte positieven + het aantal echte negatieven)/(aantal echte positieven + aantal echte negatieven + aantal valse positieven + aantal valse negatieven). True positieven zijn voorbeelden met een positief label dat je als positief bestempeld hebt, bijvoorbeeld je hebt een hotdog als hotdog gelabeld. Op dezelfde manier zijn echte negatieven voorbeelden met een negatief label dat je als negatief bestempelde, bijvoorbeeld je bestempelde een kat als geen hotdog. Aan de andere kant, false positieven zijn voorbeelden die negatief waren dat je als positief bestempeld, bijv., je bestempelde een kat als een hotdog (Hoe kon je!?) en ook valse negatieven zijn voorbeelden die positief waren dat je negatief bestempeld, b. v.je een hotdog gelabeld als geen hotdog. De Waar of onwaar in waar positief, vals negatief, enz., geeft aan of je het correct hebt gelabeld of niet, en positief of negatief is wat je het hebt gelabeld. Dus nauwkeurigheid is gewoon het aantal dingen dat je correct hebt gelabeld als positief en negatief gedeeld door het totale aantal dingen dat je hebt gelabeld., In het geval dat u probeert om een heleboel dingen te classificeren in plaats van slechts een, de algemene nauwkeurigheid is gewoon het aantal dingen die je correct gelabeld in elke categorie gedeeld door het totale aantal dingen die je gelabeld.

precisie is een maat die je vertelt hoe vaak dat iets dat je als positief bestempelt eigenlijk positief is. Meer formeel met behulp van de notatie van eerdere, precisie is het aantal true positieven/ (het aantal true positieven plus het aantal false positieven). Aan de andere kant, recall is de maat die je vertelt het percentage positieven die je correct labelt., Dat wil zeggen, recall is het aantal echte positieven / (het aantal echte positieven plus het aantal valse negatieven). Het verschil tussen precisie en herinnering is een beetje subtiel, dus laat me herhalen: precisie is het aantal positieve voorbeelden dat je correct hebt gelabeld over het totale aantal keren dat je iets positiefs hebt gelabeld, terwijl herinneren het aantal positieve voorbeelden is dat je correct hebt gelabeld over het totale aantal dingen dat eigenlijk positief was. Je kunt denken aan precisie als de verhouding van de tijden dat wanneer je haar positief voorspelt, het eigenlijk positief blijkt te zijn., Waar als herinnering kan worden gezien als nauwkeurigheid over alleen de positieven – het is de verhouding van de keren dat je positief correct over het aantal keren dat het eigenlijk positief was geëtiketteerd.

in het geval van meerdere etiketten worden precisie en terugroeping gewoonlijk per categorie toegepast. Dat wil zeggen, als je probeert te raden of een foto heeft een kat of hond of andere dieren, zou je precisie en recall voor uw katten en honden afzonderlijk te krijgen., Dan is het gewoon weer het binaire geval-als je de precisie voor katten wilt, neem je het aantal keren dat je goed geraden hebt dat het kat was / het totale aantal keren dat je geraden hebt dat iets een kat was. Evenzo, als u zin voor krijgen recall voor katten, u nemen het aantal keren u goed geraden het was een kat over het totale aantal keren het was eigenlijk een kat.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *