Tienes un modelo, y ahora quieres juzgar qué tan bien funciona. ¿Cómo se mide la eficacia del modelo?
Hay varias métricas que podría usar para juzgar qué tan bueno es un modelo de clasificación, las más comunes son la precisión, la precisión y el recuerdo. La precisión mide la cantidad de datos que etiquetó correctamente. Es decir, la precisión es la relación del número etiquetado correctamente sobre el número total. Si usted está tratando de clasificar en una sola cosa (por ejemplo,, perro caliente o no), la precisión puede ser escrito como (el número de verdaderos positivos + el número de verdaderos negativos)/(número de verdaderos positivos + número de verdaderos negativos + número de falsos positivos + número de falsos negativos). Los verdaderos positivos son ejemplos con una etiqueta positiva que etiquetaste como positiva, por ejemplo, etiquetaste un perro caliente como un perro caliente. Del mismo modo, los verdaderos negativos son ejemplos con una etiqueta negativa que etiquetaste como negativa, por ejemplo, etiquetaste a un gato como no un perro caliente. Por otro lado, los falsos positivos son ejemplos que fueron negativos que la etiqueta positiva, por ejemplo,, etiquetaste a un gato como un perro caliente (¡Cómo pudiste!?) y de manera similar, los falsos negativos son ejemplos positivos que usted etiquetó como negativos, por ejemplo, usted etiquetó a un perro caliente como no un perro caliente. El verdadero o falso en verdadero positivo, falso negativo, etc. indica si la etiqueta es correcta o no, positivos o negativos, es lo que marcado. Así que la precisión es el número de cosas que usted correctamente etiquetados como positivo y negativo dividido por el número total de las cosas etiqueta., En el caso de que esté tratando de clasificar muchas cosas en lugar de solo una, la precisión general es solo el número de cosas que etiquetó correctamente en cada categoría dividido por el número total de cosas que etiquetó.
La precisión es una medida que te dice con qué frecuencia ese algo que etiquetas como positivo es realmente positivo. Más formalmente usando la notación anterior, la precisión es el número de positivos verdaderos / (el número de positivos verdaderos más el número de positivos falsos). Por otro lado, el recuerdo es la medida que le indica el porcentaje de positivos que etiqueta correctamente., Es decir, recordar es el número de verdaderos positivos/(el número de verdaderos positivos más el número de falsos negativos). La diferencia entre precisión y recuerdo es un poco sutil, así que permítanme reiterar: la precisión es el número de ejemplos positivos que etiquetó correctamente sobre el número total de veces que etiquetó algo positivo, mientras que el recuerdo es el número de ejemplos positivos que etiquetó correctamente sobre el número total de cosas que eran realmente positivas. Se puede pensar en la precisión como la proporción de veces que cuando se predice Su positivo en realidad resulta ser positivo., Donde como recuerdo se puede pensar como precisión sobre solo los positivos-es la proporción de veces que etiquetó positivo correctamente sobre la cantidad de veces que fue realmente positivo.
en el caso de etiquetas múltiples, la precisión y el recuerdo se aplican generalmente por categoría. Es decir, si está tratando de adivinar si una imagen tiene un gato o un perro u otros animales, obtendrá precisión y recuperación para sus gatos y perros por separado., Entonces es solo el caso binario de nuevo-si quieres la precisión para los gatos, tomas el número de veces que adivinaste correctamente que era gato / el número total de veces que adivinaste que algo era un gato. Del mismo modo, si desea obtener el recuerdo de los gatos, toma el número de veces que adivinó correctamente que era un gato sobre el número total de veces que era en realidad un gato.