Você tem um modelo, e agora você quer julgar o quão bem ele executa. Como medir a eficácia do modelo?
Existem várias métricas que você poderia usar para julgar quão bom é um modelo de classificação, o mais comum dos quais são precisão, precisão e recall. A precisão mede a quantidade de dados que rotulou correctamente. Ou seja, precisão é a razão que o número marcado corretamente sobre o número total. Se você está tentando classificar apenas uma coisa (e.g., cachorro-quente ou não), a precisão pode ser escrito como (o número de verdadeiros positivos + o número de verdadeiros negativos)/(número de verdadeiros positivos + número de verdadeiros negativos + número de falso-positivos + número de falso-negativos). Verdadeiros positivos são exemplos com um rótulo positivo que você rotulou como positivo, por exemplo, você rotulou um cachorro-quente como um cachorro-quente. Da mesma forma, os negativos verdadeiros são exemplos com um rótulo negativo que você rotulou como negativo, por exemplo, você rotulou um gato como não um cachorro quente. Por outro lado, falsos positivos são exemplos negativos que você rotulou de positivos, e.g., você rotulou um gato como um cachorro quente (como você poderia!?) e igualmente falsos negativos são exemplos que foram positivos que você rotulou negativo, por exemplo, você rotulou um cachorro-quente como não um cachorro-quente. O verdadeiro ou falso em verdadeiro positivo, falso negativo, etc., indica se você rotulou corretamente ou não, e positivo ou negativo é o que você rotulou. Então a precisão é apenas o número de coisas que você rotulado corretamente como positivo e negativo dividido pelo número total de coisas que você rotulado., No caso em que você está tentando classificar um monte de coisas em vez de apenas uma, a precisão geral é apenas o número de coisas que você rotulado corretamente em cada categoria dividida pelo número total de coisas que você rotulado.
precisão é uma medida que diz com que frequência algo que você rotula como positivo é realmente positivo. Mais formalmente usando a notação de anteriormente, precisão é o número de positivos verdadeiros / (o número de positivos verdadeiros mais o número de falsos positivos). Por outro lado, recordar é a medida que lhe diz a percentagem de positivos que você rotula corretamente., Isto é, recordar é o número de verdadeiros positivos/(o número de verdadeiros positivos mais o número de falsos negativos). A diferença entre a precisão e o recall é uma espécie de sutil, então deixe-me reiterar: a precisão é o número de exemplos positivos que você rotuladas corretamente sobre o número total de vezes que você rotulado como algo positivo, enquanto que a recuperação é o número de exemplos positivos que você rotuladas corretamente sobre o número total de coisas que, na verdade, foram positivos. Você pode pensar na precisão como a proporção de vezes que quando você prevê o seu positivo ele realmente acaba por ser positivo., Onde, como recordação, pode ser pensado como precisão sobre apenas os positivos – é a proporção de vezes que você rotulou positivo corretamente sobre a quantidade de vezes que foi realmente positivo.
no caso de vários rótulos, a precisão e a recolha são normalmente aplicadas por categoria. Isto é, se você está tentando adivinhar se uma imagem tem um gato ou cão ou outros animais, você obterá precisão e recordar para seus gatos e cães separadamente., Então é apenas o caso binário novamente-se você quer a precisão para gatos, você pega o número de vezes que você adivinhou corretamente que era gato / o número total de vezes que você adivinhou qualquer coisa era um gato. Da mesma forma, se você quiser se lembrar para gatos, você tomar o número de vezes que você adivinhou corretamente era um gato sobre o número total de vezes que era realmente um gato.