Vous avez un modèle, et maintenant vous voulez juger de la façon dont il effectue. Comment mesurez-vous l’efficacité du modèle?
Il existe plusieurs métriques que vous pouvez utiliser pour juger de la qualité d’un modèle de classification, dont les plus courantes sont l’exactitude, la précision et le rappel. La précision mesure la quantité de données que vous étiquetés correctement. C’est-à-dire que la précision est le rapport entre le nombre étiqueté correctement et le nombre total. Si vous essayez de classer une seule chose (par exemple, hot-dog ou pas), la précision peut être écrite (le nombre de vrais positifs + le nombre de vrais négatifs)/(nombre de vrais positifs + nombre de vrais négatifs + faux positifs + faux négatifs). Les vrais positifs sont des exemples avec une étiquette positive que vous avez étiquetée comme positive, par exemple, vous avez étiqueté un hot-dog comme un hot-dog. De même, les vrais négatifs sont des exemples avec une étiquette négative que vous avez étiquetée comme négative, par exemple, vous avez étiqueté un chat comme n’étant pas un hot-dog. D’autre part, les faux positifs sont des exemples qui étaient négatifs que vous avez étiquetés positifs, par exemple, vous avez marqué un chat comme un hot-dog (comment pourriez-vous!?) et de même, les faux négatifs sont des exemples positifs que vous avez étiquetés négatifs, par exemple, vous avez étiqueté un hot-dog comme n’étant pas un hot-dog. Le vrai ou faux en vrai positif, faux négatif, etc. indique si vous étiquetés correctement ou non, positif ou négatif, est ce que vous étiquetés il. Ainsi, la précision est juste le nombre de choses que vous avez correctement étiquetées comme positives et négatives divisé par le nombre total de choses que vous avez étiquetées., Dans le cas où vous essayez de classer beaucoup de choses au lieu d’une seule, la précision globale est juste le nombre de choses que vous avez correctement étiquetées dans chaque catégorie divisé par le nombre total de choses que vous avez étiquetées.
la précision est une mesure qui vous indique à quelle fréquence quelque chose que vous étiquetez comme positif est en fait positif. Plus formellement en utilisant la notation précédente, la précision est le nombre de vrais positifs/ (le nombre de vrais positifs plus le nombre de faux positifs). D’autre part, le rappel est une mesure qui indique le pourcentage de positifs étiqueter correctement., Qui est, rappelons le) est le nombre de vrais positifs/(le nombre de vrais positifs, plus le nombre de faux négatifs). La différence entre la précision et le rappel est un peu subtile, alors permettez-moi de répéter: la précision est le nombre d’exemples positifs que vous avez étiquetés correctement sur le nombre total de fois que vous avez étiqueté quelque chose de positif, alors que le rappel est le nombre d’exemples positifs que vous avez étiquetés correctement sur le nombre total Vous pouvez penser à la précision comme la proportion de fois que lorsque vous prédisez son positif, il s’avère en fait positif., Où comme rappel peut être considéré comme une précision sur les points positifs-c’est la proportion de fois que vous avez étiqueté positif correctement sur le nombre de fois qu’il était réellement positif.
dans le cas des étiquettes multiples, la précision et le rappel sont généralement appliqués par catégorie. Autrement dit, si vous essayez de deviner si une image a un chat ou un chien ou d’autres animaux, vous obtiendrez la précision et le rappel pour vos chats et chiens séparément., Ensuite, c’est juste le cas binaire à nouveau – si vous voulez la précision pour les chats, vous prenez le nombre de fois que vous avez deviné correctement que c’était un chat / le nombre total de fois que vous avez deviné que quelque chose était un chat. De même, si vous souhaitez obtenir un rappel pour les chats, vous prenez le nombre de fois que vous avez deviné correctement qu’il s’agissait d’un chat sur le nombre total de fois qu’il s’agissait en fait d’un chat.