Une introduction rapide à l’analyse bivariée



Le terme analyse bivariée fait référence à l’analyse de deux variables. Vous pouvez vous en souvenir car le préfixe « bi » signifie « deux ».

Le but de l’analyse bivariée est de comprendre la relation entre deux variables. Vous pouvez comparer ce type d’analyse avec ce qui suit :

  • Analyse univariée : L’analyse d’une variable.
  • Analyse multivariée : analyse de deux variables ou plus.

Il existe trois manières courantes d’effectuer une analyse bivariée :

1. Nuages de points.

2. Coefficients de corrélation.

3. Régression linéaire simple.

Ce didacticiel fournit un exemple de chacun de ces types d’analyse bivariée à l’aide de l’ensemble de données suivant qui contient des informations sur deux variables : (1) Heures passées à étudier et (2) Résultats d’examen obtenus par 20 étudiants différents :

1. Nuages de points

Un nuage de points offre un moyen visuel d’effectuer une analyse bivariée. Il nous permet de visualiser la relation entre deux variables en plaçant la valeur d’une variable sur l’axe des x et la valeur de l’autre variable sur l’axe des y.

Dans le nuage de points ci-dessous, nous plaçons les heures étudiées sur l’axe des x et les résultats de l’examen sur l’axe des y :

Analyse bivariée avec un nuage de points

Nous pouvons clairement voir qu’il existe une relation positive entre les deux variables : à mesure que le nombre d’heures d’études augmente, les résultats aux examens ont également tendance à augmenter.

2. Coefficients de corrélation

Un coefficient de corrélation offre une autre façon d’effectuer une analyse bivariée. Le type de coefficient de corrélation le plus courant est le coefficient de corrélation de Pearson , qui est une mesure de l’association linéaire entre deux variables.   Il a une valeur comprise entre -1 et 1 où :

  • -1 indique une corrélation linéaire parfaitement négative entre deux variables
  • 0 indique aucune corrélation linéaire entre deux variables
  • 1 indique une corrélation linéaire parfaitement positive entre deux variables

Cette métrique simple nous donne une bonne idée de la façon dont deux variables sont liées. En pratique, nous utilisons souvent des nuages de points et des coefficients de corrélation pour comprendre la relation entre deux variables afin de pouvoir visualiser et quantifier leur relation.

3. Régression linéaire simple

Une troisième façon d’effectuer une analyse bivariée consiste à utiliser une régression linéaire simple .

En utilisant cette méthode, nous choisissons une variable comme variable explicative et l’autre variable comme variable de réponse . Nous trouvons ensuite la ligne qui « correspond » le mieux à l’ensemble de données, que nous pouvons ensuite utiliser pour comprendre la relation exacte entre les deux variables.

Par exemple, la ligne la mieux adaptée pour l’ensemble de données ci-dessus est :

Note à l’examen = 69,07 + 3,85*(heures étudiées)

Cela signifie que chaque heure supplémentaire étudiée est associée à une augmentation moyenne de la note à l’examen de 3,85. En ajustant ce modèle de régression linéaire, nous pouvons quantifier la relation exacte entre les heures étudiées et la note obtenue à l’examen.

Connexe : Comment effectuer une régression linéaire simple dans Excel

Conclusion

L’analyse bivariée est l’un des types d’analyse les plus couramment utilisés en statistique, car nous souhaitons souvent comprendre la relation entre deux variables.

En utilisant des nuages de points, des coefficients de corrélation et une régression linéaire simple, nous pouvons visualiser et quantifier la relation entre deux variables.

Souvent, ces trois méthodes sont utilisées ensemble dans une analyse pour obtenir une image complète de la relation entre deux variables. C’est donc une bonne idée de vous familiariser avec chaque méthode.

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *