Comment calculer la précision équilibrée en Python à l’aide de sklearn



La précision équilibrée est une mesure que nous pouvons utiliser pour évaluer les performances d’un modèle de classification .

Il est calculé comme suit :

Précision équilibrée = (Sensibilité + Spécificité) / 2

où:

  • Sensibilité : Le « vrai taux de positif » – le pourcentage de cas positifs que le modèle est capable de détecter.
  • Spécificité : Le « vrai taux négatif » – le pourcentage de cas négatifs que le modèle est capable de détecter.

Cette métrique est particulièrement utile lorsque les deux classes sont déséquilibrées, c’est-à-dire qu’une classe apparaît beaucoup plus que l’autre.

Par exemple, supposons qu’un analyste sportif utilise un modèle de régression logistique pour prédire si 400 joueurs de basket-ball universitaire différents seront recrutés ou non dans la NBA.

La matrice de confusion suivante résume les prédictions faites par le modèle :

Pour calculer la précision équilibrée du modèle, nous allons d’abord calculer la sensibilité et la spécificité :

  • Sensibilité : Le « taux de vrais positifs » = 15 / (15 + 5) = 0,75
  • Spécificité : Le « taux vrai négatif » = 375 / (375 + 5) = 0,9868

Nous pouvons alors calculer la précision équilibrée comme suit :

  • Précision équilibrée = (Sensibilité + Spécificité) / 2
  • Précision équilibrée = (0,75 + 9868) / 2
  • Précision équilibrée = 0,8684

La précision équilibrée du modèle s’avère être de 0,8684 .

L’exemple suivant montre comment calculer la précision équilibrée pour ce scénario précis à l’aide de la fonction Balanced_accuracy_score() de la bibliothèque sklearn en Python.

Exemple : calcul de la précision équilibrée en Python

Le code suivant montre comment définir un tableau de classes prédites et un tableau de classes réelles, puis calculer la précision équilibrée d’un modèle en Python :

import numpy as np
from sklearn.metrics import balanced_accuracy_score

#define array of actual classes
actual = np.repeat([1, 0], repeats=[20, 380])

#define array of predicted classes
pred = np.repeat([1, 0, 1, 0], repeats=[15, 5, 5, 375])

#calculate balanced accuracy score
balanced_accuracy_score(actual, pred)

0.868421052631579

La précision équilibrée est de 0,8684 . Cela correspond à la valeur que nous avons calculée manuellement plus tôt.

Remarque : Vous pouvez trouver la documentation complète de la fonction Balanced_accuracy_score() ici .

Ressources additionnelles

Une introduction à la précision équilibrée
Comment effectuer une régression logistique en Python
Comment calculer le score F1 en Python

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *