Test d’indépendance du chi carré : définition, formule et exemple



Un test d’indépendance du chi carré est utilisé pour déterminer s’il existe ou non une association significative entre deux variables catégorielles.

Ce tutoriel explique les éléments suivants :

  • La motivation pour effectuer un test d’indépendance du chi carré.
  • La formule pour effectuer un test d’indépendance du chi carré.
  • Un exemple de la façon d’effectuer un test d’indépendance du chi carré.

Test d’indépendance du chi carré : motivation

Un test d’indépendance du Chi carré peut être utilisé pour déterminer s’il existe une association entre deux variables catégorielles dans de nombreux contextes différents. Voici quelques exemples:

  • Nous voulons savoir si le sexe est associé à la préférence pour un parti politique. Nous interrogeons donc 500 électeurs et enregistrons leur sexe et leur préférence pour le parti politique.
  • Nous voulons savoir si la couleur préférée d’une personne est associée à son sport préféré. Nous interrogeons donc 100 personnes et leur demandons quelles sont leurs préférences pour les deux.
  • Nous voulons savoir si le niveau d’éducation et l’état civil sont associés. Nous collectons donc des données sur ces deux variables sur un échantillon aléatoire simple de 50 personnes.

Dans chacun de ces scénarios, nous voulons savoir si deux variables catégorielles sont associées entre elles. Dans chaque scénario, nous pouvons utiliser un test d’indépendance du Chi carré pour déterminer s’il existe une association statistiquement significative entre les variables.

Test d’indépendance du chi carré : formule

Un test d’indépendance du chi carré utilise les hypothèses nulles et alternatives suivantes :

  • H 0 : (hypothèse nulle) Les deux variables sont indépendantes.
  • H 1 : (hypothèse alternative) Les deux variables ne sont pas indépendantes. (c’est-à-dire qu’ils sont associés)

Nous utilisons la formule suivante pour calculer la statistique du test du Chi carré X 2 :

X 2 = Σ(OE) 2 / E

où:

  • Σ : est un symbole fantaisiste qui signifie « somme »
  • O : valeur observée
  • E : valeur attendue

Si la valeur p qui correspond à la statistique de test X 2 avec (#lignes-1)*(#colonnes-1) degrés de liberté est inférieure au niveau de signification choisi, vous pouvez alors rejeter l’hypothèse nulle.

Test d’indépendance du chi carré : exemple

Supposons que nous voulions savoir si le genre est associé ou non à la préférence pour un parti politique. Nous prenons un échantillon aléatoire simple de 500 électeurs et les interrogeons sur leur préférence en matière de parti politique. Le tableau suivant présente les résultats de l’enquête :

Républicain Démocrate Indépendant Total
Mâle 120 90 40 250
Femelle 110 95 45 250
Total 230 185 85 500

Suivez les étapes suivantes pour effectuer un test d’indépendance du chi carré afin de déterminer si le sexe est associé à la préférence du parti politique.

Étape 1 : Définir les hypothèses.

Nous effectuerons le test d’indépendance du Chi carré en utilisant les hypothèses suivantes :

  • H 0 : Le sexe et les préférences en matière de parti politique sont indépendants.
  • H 1 : Le sexe et les préférences en matière de parti politique ne sont pas indépendants.

Étape 2 : Calculez les valeurs attendues.

Ensuite, nous calculerons les valeurs attendues pour chaque cellule du tableau de contingence en utilisant la formule suivante :

Valeur attendue = (somme des lignes * somme des colonnes) / somme du tableau.

Par exemple, la valeur attendue pour les hommes républicains est : (230*250) / 500 = 115 .

Nous pouvons répéter cette formule pour obtenir la valeur attendue pour chaque cellule du tableau :

Républicain Démocrate Indépendant Total
Mâle 115 92,5 42,5 250
Femelle 115 92,5 42,5 250
Total 230 185 85 500

Étape 3 : Calculez (OE) 2 / E pour chaque cellule du tableau.

Ensuite, nous calculerons (OE) 2 / E pour chaque cellule du tableau où :

  • O : valeur observée
  • E : valeur attendue

Par exemple, les Républicains masculins auraient une valeur de : (120-115) 2 /115 = 0,2174 .

Nous pouvons répéter cette formule pour chaque cellule du tableau :

Républicain Démocrate Indépendant
Mâle 0,2174 0,0676 0,1471
Femelle 0,2174 0,0676 0,1471

Étape 4 : Calculez la statistique de test X 2 et la valeur p correspondante.

X 2 = Σ(OE) 2 / E = 0,2174 + 0,2174 + 0,0676 + 0,0676 + 0,1471 + 0,1471 = 0,8642

Selon le calculateur du score du chi carré vers la valeur P , la valeur p associée à X 2 = 0,8642 et (2-1)*(3-1) = 2 degrés de liberté est de 0,649198 .

Étape 5 : Tirez une conclusion.

Puisque cette valeur p n’est pas inférieure à 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle. Cela signifie que nous ne disposons pas de preuves suffisantes pour affirmer qu’il existe une association entre le sexe et les préférences en matière de parti politique.

Remarque : Vous pouvez également effectuer l’intégralité de ce test en utilisant simplement le calculateur du test d’indépendance du chi carré .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer un test d’indépendance du chi carré à l’aide de différents programmes statistiques :

Comment effectuer un test d’indépendance du chi carré dans Stata
Comment effectuer un test d’indépendance du chi carré dans Excel
Comment effectuer un test d’indépendance du chi carré dans SPSS
Comment effectuer un test d’indépendance du chi carré en Python
Comment effectuer un test d’indépendance du chi carré dans R
Test d’indépendance du chi carré sur une calculatrice TI-84
Calculatrice du test du chi carré d’indépendance

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *