Comprendre la matrice de confusion ne doit pas être déroutant. Vous trouverez ci-dessous une explication simple ainsi qu’une astuce pour vous aider à vous en souvenir par cœur.
Quand utilisons-nous Confusion Matrix?
La matrice de confusion est utilisée pour évaluer les modèles de classification. Gardez à l’esprit que cela n’est pas utilisé pour évaluer les modèles de régression linéaire. Les modèles de classification classent le résultat en deux ou plusieurs catégories (par exemple, si un e-mail est du spam ou non), tandis que la régression linéaire prédit un nombre (par exemple, la prévision du prix de l’immobilier).
Qu’est-ce qu’une matrice de confusion?
Étant donné un certain nombre de catégories, C, la matrice de confusion consiste en un affichage tabulaire C x C du nombre d’enregistrements en fonction de leur classe réelle et prévue. Par exemple, si nous prédisons si un e-mail est du spam ou non, nous aurions un tableau 2 x 2, comme illustré dans la figure ci-dessous.

Matrice de confusion 2 x 2
Les catégories positives et négatives peuvent être interchangeables, par exemple, dans le cas de la classification des e-mails de spam, nous pouvons soit affecter la catégorie positive (+) à spam ou non-spam. Prenons le positif (+) comme spam.
Explication:
Vrai positif: la catégorie réelle et la catégorie prédite sont toutes deux positives. Nombre de fois où le modèle a correctement classé un e-mail comme spam.
Vrai négatif: la catégorie réelle et la catégorie prévue sont toutes deux négatives. Nombre de fois où le modèle a correctement classé un e-mail comme non-spam.
Faux positif: la catégorie réelle est négative et la catégorie prédite est positive. Nombre de fois où le modèle a classé un e-mail comme spam, alors qu’il ne s’agit en fait pas de spam.
Faux négatif: la catégorie réelle est positive et la catégorie prédite est négative. Nombre de fois où le modèle a classé un e-mail comme non-spam, alors qu’il s’agit en fait de spam.
Ok, il est peut-être facile de se souvenir du vrai positif et du vrai négatif. En termes simples, ils le sont lorsque la réalité et la prédiction sont identiques. Cependant, il peut être un peu difficile de se rappeler lequel est faux positif et lequel est faux négatif. Se souvenir du quadrant ne fonctionnera pas car les lignes et les colonnes peuvent être modifiées dans un autre matrice (pour l’instant, il n’y a pas de méthode standard pour représenter la matrice).
Ne vous inquiétez pas! Voici un truc simple que j’ai découvert moi-même, pour aider à me souvenir des faux négatifs et faux positifs par cœur.

Source: formation SEO Lille.