Personnaliser les préférences

Nous utilisons des cookies pour vous aider à naviguer efficacement et à exécuter certaines fonctions. Vous trouverez ci-dessous des informations détaillées sur tous les cookies sous chaque catégorie de consentement.

Les cookies classés comme « Nécessaires » sont stockés sur votre navigateur car ils sont essentiels pour activer les fonctionnalités de base du site.... 

Toujours actif

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

Aucun cookie à afficher.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

Aucun cookie à afficher.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

Aucun cookie à afficher.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

Aucun cookie à afficher.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

Aucun cookie à afficher.

Comment calculer le VIF dans Excel



La multicolinéarité dans l’analyse de régression se produit lorsque deux ou plusieurs variables explicatives sont fortement corrélées les unes aux autres, de sorte qu’elles ne fournissent pas d’informations uniques ou indépendantes dans le modèle de régression. Si le degré de corrélation est suffisamment élevé entre les variables, cela peut poser des problèmes lors de l’ajustement et de l’interprétation du modèle de régression.

Heureusement, il est possible de détecter la multicolinéarité à l’aide d’une métrique appelée facteur d’inflation de la variance (VIF) , qui mesure la corrélation et la force de la corrélation entre les variables explicatives dans un modèle de régression.

Ce tutoriel explique comment calculer VIF dans Excel.

Exemple : calcul du VIF dans Excel

Pour cet exemple, nous effectuerons une régression linéaire multiple en utilisant l’ensemble de données suivant qui décrit les attributs de 10 joueurs de basket-ball. Nous ajusterons un modèle de régression en utilisant la note comme variable de réponse et les points, les passes décisives et les rebonds comme variables explicatives. Ensuite, nous identifierons les valeurs VIF pour chaque variable explicative.

Données brutes dans Excel

Étape 1 : Effectuez une régression linéaire multiple.

Dans le ruban supérieur, accédez à l’onglet Données et cliquez sur Analyse des données. Si vous ne voyez pas cette option, vous devez d’abord installer le logiciel gratuit Analysis ToolPak .

Toolpak d’analyse de données dans Excel

Une fois que vous avez cliqué sur Analyse des données, une nouvelle fenêtre apparaîtra. Sélectionnez Régression et cliquez sur OK.

Régression avec Data Analysis Toolpak dans Excel

Remplissez les tableaux nécessaires pour les variables de réponse et les variables explicatives, puis cliquez sur OK.

Régression multiple dans Excel

Cela produit le résultat suivant :

Sortie de régression dans Excel

Étape 2 : Calculez le VIF pour chaque variable explicative.

Ensuite, nous pouvons calculer le VIF pour chacune des trois variables explicatives en effectuant des régressions individuelles en utilisant une variable explicative comme variable de réponse et les deux autres comme variables explicatives.

Par exemple, nous pouvons calculer le VIF pour la variable points en effectuant une régression linéaire multiple en utilisant les points comme variable de réponse et les assistances et les rebonds comme variables explicatives.

Cela produit le résultat suivant :

Calculer le VIF dans Excel

Le VIF pour les points est calculé comme 1 / (1 – R Square) = 1 / (1 – .433099) = 1,76 .

Nous pouvons ensuite répéter ce processus pour les deux autres variables, passes décisives et rebonds .

Il s’avère que les VIF pour les trois variables explicatives sont les suivants :

points : 1,76
passes décisives : 1,96
rebonds : 1,18

Comment interpréter les valeurs VIF

La valeur de VIF commence à 1 et n’a pas de limite supérieure. Une règle générale pour interpréter les VIF est la suivante :

  • Une valeur de 1 indique qu’il n’y a aucune corrélation entre une variable explicative donnée et toute autre variable explicative du modèle.
  • Une valeur comprise entre 1 et 5 indique une corrélation modérée entre une variable explicative donnée et d’autres variables explicatives du modèle, mais elle n’est souvent pas suffisamment grave pour nécessiter une attention particulière.
  • Une valeur supérieure à 5 indique une corrélation potentiellement sévère entre une variable explicative donnée et d’autres variables explicatives du modèle. Dans ce cas, les estimations des coefficients et les valeurs p dans les résultats de la régression ne sont probablement pas fiables.

Étant donné que chacune des valeurs VIF des variables explicatives de notre modèle de régression est proche de 1, la multicolinéarité n’est pas un problème dans notre exemple.

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *