Comment effectuer une régression logistique dans Excel
La régression logistique est une méthode que nous utilisons pour ajuster un modèle de régression lorsque la variable de réponse est binaire.
Ce didacticiel explique comment effectuer une régression logistique dans Excel.
Exemple : régression logistique dans Excel
Utilisez les étapes suivantes pour effectuer une régression logistique dans Excel pour un ensemble de données indiquant si les joueurs de basket-ball universitaire ont été repêchés ou non dans la NBA (repêchage : 0 = non, 1 = oui) en fonction de leur moyenne de points, de rebonds et de passes décisives dans le passé. saison.
Étape 1 : Saisissez les données.
Tout d’abord, saisissez les données suivantes :
Étape 2 : saisissez les cellules pour les coefficients de régression.
Puisque nous avons trois variables explicatives dans le modèle (pts, rebs, ast), nous allons créer des cellules pour trois coefficients de régression plus une pour l’origine dans le modèle. Nous définirons les valeurs de chacun d’eux sur 0,001, mais nous les optimiserons plus tard.
Ensuite, nous devrons créer quelques nouvelles colonnes que nous utiliserons pour optimiser ces coefficients de régression, notamment le logit, e logit , la probabilité et le log de vraisemblance.
Étape 3 : Créez des valeurs pour le logit.
Ensuite, nous allons créer la colonne logit en utilisant la formule suivante :
Étape 4 : Créez des valeurs pour e logit .
Ensuite, nous allons créer des valeurs pour e logit en utilisant la formule suivante :
Étape 5 : Créez des valeurs de probabilité.
Ensuite, nous allons créer des valeurs de probabilité en utilisant la formule suivante :
Étape 6 : Créez des valeurs pour la vraisemblance du journal.
Ensuite, nous allons créer des valeurs pour le log de vraisemblance en utilisant la formule suivante :
Log de vraisemblance = LN (Probabilité)
Étape 7 : Trouvez la somme des probabilités du journal.
Enfin, nous trouverons la somme des log-vraisemblances, qui est le nombre que nous tenterons de maximiser pour résoudre les coefficients de régression.
Étape 8 : utilisez le solveur pour résoudre les coefficients de régression.
Si vous n’avez pas encore installé le solveur dans Excel, procédez comme suit pour le faire :
- Cliquez sur Fichier .
- Cliquez sur Options .
- Cliquez sur Compléments .
- Cliquez sur Complément Solver , puis cliquez sur Aller .
- Dans la nouvelle fenêtre qui apparaît, cochez la case à côté de Solver Add-In , puis cliquez sur Go .
Une fois le solveur installé, accédez au groupe Analyse dans l’onglet Données et cliquez sur Solveur . Entrez les informations suivantes:
- Définir l’objectif : choisissez la cellule H14 qui contient la somme des probabilités logarithmiques.
- En modifiant les cellules variables : choisissez la plage de cellules B15 : B18 qui contient les coefficients de régression.
- Rendre les variables sans contrainte non négatives : décochez cette case.
- Sélectionnez une méthode de résolution : choisissez GRG non linéaire.
Cliquez ensuite sur Résoudre .
Le Solver calcule automatiquement les estimations du coefficient de régression :
Par défaut, les coefficients de régression peuvent être utilisés pour trouver la probabilité que le projet = 0.
Cependant, généralement dans la régression logistique, nous nous intéressons à la probabilité que la variable de réponse = 1.
Ainsi, on peut simplement inverser les signes sur chacun des coefficients de régression :
Ces coefficients de régression peuvent désormais être utilisés pour trouver la probabilité que le projet = 1.
Par exemple, supposons qu’un joueur marque en moyenne 14 points par match, 4 rebonds par match et 5 passes décisives par match. La probabilité que ce joueur soit recruté dans la NBA peut être calculée comme suit :
P(projet = 1) = e 3,681193 + 0,112827*(14) -0,39568*(4) – 0,67954*(5) / (1+e 3,681193 + 0,112827*(14) -0,39568*(4) – 0,67954*(5 ) ) = 0,57 .
Puisque cette probabilité est supérieure à 0,5, nous prédisons que ce joueur être enrôlé dans la NBA.
Connexe : Comment créer une courbe ROC dans Excel (étape par étape)