Personnaliser les préférences

Nous utilisons des cookies pour vous aider à naviguer efficacement et à exécuter certaines fonctions. Vous trouverez ci-dessous des informations détaillées sur tous les cookies sous chaque catégorie de consentement.

Les cookies classés comme « Nécessaires » sont stockés sur votre navigateur car ils sont essentiels pour activer les fonctionnalités de base du site.... 

Toujours actif

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

Aucun cookie à afficher.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

Aucun cookie à afficher.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

Aucun cookie à afficher.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

Aucun cookie à afficher.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

Aucun cookie à afficher.

Comment calculer la corrélation entre continu et & Variables catégorielles



Lorsque nous souhaitons calculer la corrélation entre deux variables continues, nous utilisons généralement le coefficient de corrélation de Pearson .

Cependant, lorsque nous souhaitons calculer la corrélation entre une variable continue et une variable catégorielle , nous pouvons utiliser ce qu’on appelle la corrélation bisériale ponctuelle .

La corrélation bisériale ponctuelle est utilisée pour calculer la corrélation entre une variable catégorielle binaire (une variable qui ne peut prendre que deux valeurs) et une variable continue et possède les propriétés suivantes :

  • La corrélation bisériale ponctuelle peut varier entre -1 et 1.
  • Pour chaque groupe créé par la variable binaire, on suppose que la variable continue est normalement distribuée avec des variances égales.
  • Pour chaque groupe créé par la variable binaire, on suppose qu’il n’y a pas de valeurs aberrantes extrêmes.

L’exemple suivant montre comment calculer une corrélation bisériale ponctuelle dans la pratique.

Exemple : Calcul d’une corrélation bisériale ponctuelle

Supposons qu’un professeur d’université souhaite déterminer s’il existe une corrélation entre le sexe et le score à un examen d’aptitude particulier.

Il recueille les données suivantes sur 12 garçons et 12 filles de sa classe :

Étant donné que le sexe est une variable catégorielle et que le score est une variable continue, il est logique de calculer une corrélation point-bisérielle entre les deux variables.

Le professeur peut utiliser n’importe quel logiciel statistique (notamment Excel, R, Python, SPSS, Stata) pour calculer la corrélation point-bisériale entre les deux variables.

Le code suivant montre comment calculer la corrélation point-bisériale dans R, en utilisant la valeur 0 pour représenter les femmes et 1 pour représenter les hommes pour la variable de genre :

#define values for gender
gender <- c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
            1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1)

#define values for score
score <- c(77, 78, 79, 79, 82, 84, 85, 88, 89, 91, 91, 94,
           84, 84, 84, 85, 85, 86, 86, 86, 89, 91, 94, 98)

#calculate point-biserial correlation
cor.test(gender, score)

	Pearson's product-moment correlation

data:  gender and score
t = 1.3739, df = 22, p-value = 0.1833
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.1379386  0.6147832
sample estimates:
      cor 
0.2810996 

À partir du résultat, nous pouvons voir que le coefficient de corrélation bisériale ponctuelle est de 0,281 et la valeur p correspondante est de 0,1833 .

Puisque le coefficient de corrélation est positif, cela nous indique qu’il existe une corrélation positive entre le sexe et le score.

Puisque nous avons codé les hommes comme 1 et les femmes comme 0, cela indique que les scores ont tendance à être plus élevés pour les hommes (c’est-à-dire que les scores ont tendance à augmenter à mesure que le sexe « augmente » de 0 à 1).

Cependant, puisque la valeur p n’est pas inférieure à 0,05, ce coefficient de corrélation n’est pas statistiquement significatif.

Ressources additionnelles

Les didacticiels suivants expliquent comment calculer la corrélation bisériale ponctuelle à l’aide de différents logiciels statistiques :

Comment calculer la corrélation point-bisériale dans Excel
Comment calculer la corrélation point-bisériale dans R
Comment calculer la corrélation point-bisériale en Python

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *