Personnaliser les préférences

Nous utilisons des cookies pour vous aider à naviguer efficacement et à exécuter certaines fonctions. Vous trouverez ci-dessous des informations détaillées sur tous les cookies sous chaque catégorie de consentement.

Les cookies classés comme « Nécessaires » sont stockés sur votre navigateur car ils sont essentiels pour activer les fonctionnalités de base du site.... 

Toujours actif

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

Aucun cookie à afficher.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

Aucun cookie à afficher.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

Aucun cookie à afficher.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

Aucun cookie à afficher.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

Aucun cookie à afficher.

Comment créer une courbe ROC dans Excel (étape par étape)



La régression logistique est une méthode statistique que nous utilisons pour ajuster un modèle de régression lorsque la variable de réponse est binaire. Pour évaluer dans quelle mesure un modèle de régression logistique s’adapte à un ensemble de données, nous pouvons examiner les deux métriques suivantes :

  • Sensibilité : probabilité que le modèle prédise un résultat positif pour une observation alors que le résultat est effectivement positif. C’est ce qu’on appelle également le « taux de vrais positifs ».
  • Spécificité : la probabilité que le modèle prédise un résultat négatif pour une observation alors que le résultat est effectivement négatif. C’est ce qu’on appelle également le « vrai taux négatif ».

Une façon de visualiser ces deux mesures consiste à créer une courbe ROC , qui signifie courbe « caractéristique de fonctionnement du récepteur ». Il s’agit d’un graphique qui affiche la sensibilité et la spécificité d’un modèle de régression logistique.

L’exemple étape par étape suivant montre comment créer et interpréter une courbe ROC dans Excel.

Étape 1 : Saisissez les données

Commençons par saisir quelques données brutes :

Étape 2 : Calculer les données cumulées

Utilisons ensuite la formule suivante pour calculer les valeurs cumulées pour les catégories Réussite et Échec :

  • Valeurs de réussite cumulées : =SUM($B$3:B3)
  • Valeurs d’échec cumulées : =SUM($C$3:C3)

Nous allons ensuite copier et coller ces formules dans chaque cellule de la colonne D et de la colonne E :

Étape 3 : Calculer le taux de faux positifs et le taux de vrais positifs

Ensuite, nous calculerons le taux de faux positifs (FPR), le taux de vrais positifs (TPR) et l’aire sous la courbe AUC) à l’aide des formules suivantes :

  • FPR : =1-D3/$D$14
  • TPR : =1-E3/$E$14
  • ASC : =(F3-F4)*G3

Nous allons ensuite copier et coller ces formules dans chaque cellule des colonnes F, G et H :

Étape 4 : Créer la courbe ROC

Pour créer la courbe ROC, nous mettrons en évidence chaque valeur de la plage F3:G14 .

Ensuite, nous cliquerons sur l’onglet Insérer le long du ruban supérieur, puis sur Insérer une dispersion (X, Y) pour créer le tracé suivant :

Courbe ROC dans Excel

Étape 5 : Calculez l’ASC

Plus la courbe épouse le coin supérieur gauche du tracé, plus le modèle parvient à classer les données en catégories.

Comme nous pouvons le voir sur le graphique ci-dessus, ce modèle de régression logistique fait un très bon travail en classant les données en catégories.

Pour quantifier cela, nous pouvons calculer l’AUC (aire sous la courbe) qui nous indique quelle partie de la parcelle est située sous la courbe.

Plus l’AUC est proche de 1, meilleur est le modèle. Un modèle avec une AUC égale à 0,5 n’est pas meilleur qu’un modèle faisant des classifications aléatoires.

Pour calculer l’AUC de la courbe, on peut simplement faire la somme de toutes les valeurs de la colonne H :

Calculer l'AUC dans Excel

L’AUC s’avère être de 0,802662 . Cette valeur est assez élevée, ce qui indique que le modèle réussit bien à classer les données en catégories « Réussite » et « Échec ».

Ressources additionnelles

Les didacticiels suivants expliquent comment créer d’autres tracés courants dans Excel :

Comment tracer un CDF dans Excel
Comment créer une courbe de survie dans Excel
Comment créer un graphique de contrôle de processus statistique dans Excel

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *