Valeur prédictive positive par rapport à la sensibilité : quelle est la différence ?



L’un des moyens les plus courants d’évaluer les performances d’un modèle de classification consiste à créer une matrice de confusion, qui résume les résultats prévus du modèle par rapport aux résultats réels de l’ensemble de données.

Deux mesures qui nous intéressent souvent dans une matrice de confusion sont la valeur prédictive positive et la sensibilité .

La valeur prédictive positive est la probabilité qu’une observation avec un résultat prédit positif ait réellement un résultat positif.

Il est calculé comme suit :

Valeur prédictive positive = Vrais Positifs / (Vrais Positifs + Faux Positifs)

La sensibilité est la probabilité qu’une observation avec un résultat positif ait réellement un résultat prédit positif.

Il est calculé comme suit :

Sensibilité = Vrais Positifs / (Vrais Positifs + Faux Négatifs)

L’exemple suivant montre comment calculer ces deux métriques dans la pratique.

Exemple : Calcul de la valeur prédictive positive et de la sensibilité

Supposons qu’un médecin utilise un modèle de régression logistique pour prédire si 400 personnes souffrent ou non d’une certaine maladie.

La matrice de confusion suivante résume les prédictions faites par le modèle :

Nous calculerions la valeur prédictive positive comme suit :

  • Valeur prédictive positive = Vrais Positifs / (Vrais Positifs + Faux Positifs)
  • Valeur prédictive positive = 15 / (15 + 10)
  • Valeur prédictive positive = 0,60

Cela nous indique que la probabilité qu’une personne recevant un résultat de test positif soit réellement atteinte de la maladie est de 0,60 .

Nous calculerions la sensibilité comme suit :

  • Sensibilité = Vrais Positifs / (Vrais Positifs + Faux Négatifs)
  • Sensibilité = 15 / (15 + 5)
  • Sensibilité = 0,75

Cela nous indique que la probabilité qu’une personne atteinte de la maladie reçoive effectivement un résultat de test positif est de 0,75 .

Ressources additionnelles

Les tutoriels suivants expliquent comment créer une matrice de confusion dans différents logiciels statistiques :

Comment créer une matrice de confusion dans Excel
Comment créer une matrice de confusion dans R
Comment créer une matrice de confusion en Python

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *