Comment calculer la précision équilibrée en Python à l’aide de sklearn
La précision équilibrée est une mesure que nous pouvons utiliser pour évaluer les performances d’un modèle de classification .
Il est calculé comme suit :
Précision équilibrée = (Sensibilité + Spécificité) / 2
où:
- Sensibilité : Le « vrai taux de positif » – le pourcentage de cas positifs que le modèle est capable de détecter.
- Spécificité : Le « vrai taux négatif » – le pourcentage de cas négatifs que le modèle est capable de détecter.
Cette métrique est particulièrement utile lorsque les deux classes sont déséquilibrées, c’est-à-dire qu’une classe apparaît beaucoup plus que l’autre.
Par exemple, supposons qu’un analyste sportif utilise un modèle de régression logistique pour prédire si 400 joueurs de basket-ball universitaire différents seront recrutés ou non dans la NBA.
La matrice de confusion suivante résume les prédictions faites par le modèle :
Pour calculer la précision équilibrée du modèle, nous allons d’abord calculer la sensibilité et la spécificité :
- Sensibilité : Le « taux de vrais positifs » = 15 / (15 + 5) = 0,75
- Spécificité : Le « taux vrai négatif » = 375 / (375 + 5) = 0,9868
Nous pouvons alors calculer la précision équilibrée comme suit :
- Précision équilibrée = (Sensibilité + Spécificité) / 2
- Précision équilibrée = (0,75 + 9868) / 2
- Précision équilibrée = 0,8684
La précision équilibrée du modèle s’avère être de 0,8684 .
L’exemple suivant montre comment calculer la précision équilibrée pour ce scénario précis à l’aide de la fonction Balanced_accuracy_score() de la bibliothèque sklearn en Python.
Exemple : calcul de la précision équilibrée en Python
Le code suivant montre comment définir un tableau de classes prédites et un tableau de classes réelles, puis calculer la précision équilibrée d’un modèle en Python :
import numpy as np from sklearn.metrics import balanced_accuracy_score #define array of actual classes actual = np.repeat([1, 0], repeats=[20, 380]) #define array of predicted classes pred = np.repeat([1, 0, 1, 0], repeats=[15, 5, 5, 375]) #calculate balanced accuracy score balanced_accuracy_score(actual, pred) 0.868421052631579
La précision équilibrée est de 0,8684 . Cela correspond à la valeur que nous avons calculée manuellement plus tôt.
Remarque : Vous pouvez trouver la documentation complète de la fonction Balanced_accuracy_score() ici .
Ressources additionnelles
Une introduction à la précision équilibrée
Comment effectuer une régression logistique en Python
Comment calculer le score F1 en Python