Comment effectuer une régression logistique dans Google Sheets



La régression logistique est une méthode que nous pouvons utiliser pour ajuster un modèle de régression lorsque la variable de réponse est binaire.

L’exemple étape par étape suivant montre comment effectuer une régression logistique dans Google Sheets.

Étape 1 : Installez le ToolPak d’analyse XLMiner

Pour effectuer une régression logistique dans Google Sheets, nous devons d’abord installer le logiciel gratuit XLMiner Analysis Toolpak .

Pour ce faire, cliquez sur Modules complémentaires > Obtenir des modules complémentaires :

Ensuite, tapez XLMiner Analysis ToolPak dans la barre de recherche et cliquez sur l’icône qui apparaît :

Installer le pack d'outils d'analyse XLMiner dans Google Sheets

Enfin, cliquez sur le bouton bleu Installer .

XLMiner Analysis Toolpak dans Google Sheets

Étape 2 : Saisissez les données

Ensuite, nous saisirons les données suivantes dans Google Sheets :

Nous adapterons un modèle de régression logistique qui utilise des points et aide à prédire si un joueur de basket-ball sera recruté dans la NBA (0 = Non, 1 = Oui).

Étape 3 : Effectuer une régression logistique

Pour ajuster le modèle de régression logistique, cliquez sur l’onglet Extensions , puis cliquez sur XL Miner Analysis ToolPak , puis cliquez sur Démarrer :

Dans le panneau qui apparaît sur le côté droit de l’écran, cliquez sur la flèche déroulante en regard de Régression logistique et saisissez les informations suivantes :

régression logistique dans Google Sheets

Une fois que vous cliquez sur OK , le résumé du modèle de régression logistique s’affichera :

sortie de régression logistique dans Google Sheets

Les coefficients dans le résultat indiquent la variation moyenne du journal des chances d’être repêché.

Par exemple, une augmentation d’une unité de points est associée à une augmentation moyenne de 0,212 des chances d’être repêché.

Le signe sur les coefficients nous indique s’il existe un positif ou un négatif associé entre chaque variable prédictive et la variable de réponse.

Par exemple, puisque les points ont un signe positif pour le coefficient, cela signifie que l’augmentation de la valeur des points augmente les chances qu’un joueur soit repêché (en supposant que les passes décisives restent constantes).

À l’inverse, puisque les passes décisives ont un signe négatif pour le coefficient, cela signifie que l’augmentation de la valeur des passes décisives diminue les chances qu’un joueur soit repêché (en supposant que les points restent constants).

Les valeurs p dans le résultat nous donnent également une idée de l’efficacité de chaque variable prédictive pour prédire la probabilité d’être repêché :

  • Valeur P pour les points : 0,02
  • Valeur P pour les passes décisives : 0,35

Nous pouvons voir que les points semblent être une variable prédictive statistiquement significative puisqu’ils ont une valeur p inférieure à 0,05, mais les aides ne semblent pas être statistiquement significatives puisqu’elles n’ont pas une valeur p inférieure à 0,05.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans Google Sheets :

Comment effectuer une régression polynomiale dans Google Sheets
Comment effectuer une régression linéaire dans Google Sheets
Comment calculer le R-carré dans Google Sheets

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *