Test du chi carré
Cet article explique ce qu’est le test du chi carré en statistiques et à quoi il sert. Vous découvrirez également comment faire un test du chi carré et, en plus, un exercice résolu étape par étape.
Qu’est-ce que le test du chi carré ?
Le test du Chi carré est un test statistique utilisé pour déterminer s’il existe une différence statistiquement significative entre la fréquence attendue et la fréquence observée.
Logiquement, la statistique du test du chi carré suit une distribution du chi carré . La valeur de la statistique du test doit donc être comparée à une valeur particulière de la distribution du chi carré. Ci-dessous, nous verrons comment est effectué le test du chi carré.
Ce type de test statistique est également connu sous le nom de test du chi carré de Pearson et est parfois représenté par le symbole de la distribution du chi carré : test χ² .
Formule de test du chi carré
La statistique du test du chi carré est égale à la somme des carrés des différences entre les valeurs observées et les valeurs attendues divisée par les valeurs attendues.
Ainsi, la formule du test du chi carré est la suivante :
Où:
- est la statistique du test du chi carré, qui suit une distribution du chi carré avec degrés de liberté.
- est la taille de l’échantillon de données.
- est la valeur observée pour les données i.
- est la valeur attendue pour les données i.
L’hypothèse nulle du test d’hypothèse d’un test du chi carré est que les valeurs observées sont équivalentes aux valeurs attendues. En revanche, l’hypothèse alternative du test est qu’une des valeurs observées est différente de sa valeur attendue.
Donc, étant donné un niveau de signification
, la statistique de test calculée doit être comparée à la valeur de test critique pour déterminer s’il faut rejeter l’hypothèse nulle ou l’hypothèse alternative :
- Si la statistique du test est inférieure à la valeur critique , l’hypothèse alternative est rejetée (et l’hypothèse nulle est acceptée).
- Si la statistique du test est supérieure à la valeur critique , l’hypothèse nulle est rejetée (et l’hypothèse alternative est acceptée).
Exemple du test du chi carré
Une fois que nous avons vu la définition du test du chi carré et quelle est sa formule, un exemple résolu étape par étape est présenté ci-dessous afin que vous puissiez voir comment ce type de test statistique est effectué.
- Le propriétaire d’un magasin affirme que 50 % de ses ventes concernent le produit A, 35 % de ses ventes concernent le produit B et 15 % de ses ventes concernent le produit C. Cependant, les unités vendues de chaque produit sont celles qu’ils sont présentés dans le tableau de contingence suivant. Analysez si les données théoriques du propriétaire sont statistiquement différentes des données réelles collectées.
Produit | Ventes observées (O i ) |
---|---|
Produit A | 453 |
Produit B | 268 |
Produit C | 79 |
Total | 800 |
Tout d’abord, nous devons calculer les valeurs attendues par le propriétaire du magasin. Pour ce faire, on multiplie le pourcentage de ventes attendues de chaque produit par le nombre de ventes totales réalisées :
Par conséquent, le tableau de distribution de fréquence du problème est le suivant :
Produit | Ventes observées (O i ) | Ventes attendues (E i ) |
---|---|---|
Produit A | 453 | 400 |
Produit B | 268 | 280 |
Produit C | 79 | 120 |
Total | 800 | 800 |
Maintenant que nous avons calculé toutes les valeurs, nous appliquons la formule du test du chi carré pour calculer la statistique du test :
Une fois la valeur de la statistique du test calculée, nous utilisons le tableau de distribution du chi carré pour trouver la valeur critique du test. La distribution du chi carré a
degrés de liberté, donc si nous choisissons un niveau de signification la valeur critique du test est la suivante :
Ainsi, la statistique du test (21,53) est supérieure à la valeur critique du test (5,991), par conséquent, l’hypothèse nulle est rejetée et l’hypothèse alternative est acceptée. Cela signifie que les données sont très différentes et que le propriétaire du magasin s’attendait donc à des ventes différentes de celles réellement réalisées.
Interprétation du test du chi carré
L’ interprétation du test du Chi carré ne peut pas se faire uniquement avec le résultat du test obtenu, mais doit être comparée à la valeur critique du test.
Logiquement, plus la valeur de la statistique de test calculée est petite, plus les données observées sont similaires aux données attendues. Ainsi, si le résultat du test du chi carré est 0, cela implique que les valeurs observées et les valeurs attendues sont exactement les mêmes. En revanche, plus le résultat du test est important, cela signifie que plus les valeurs observées sont différentes des valeurs attendues.
Cependant, pour décider si les deux ensembles de données sont statistiquement différents ou égaux, il faut comparer la valeur calculée du test avec la valeur critique du test, afin de rejeter l’hypothèse nulle ou l’hypothèse alternative du contraste. Si la statistique de test est inférieure à la valeur critique de la distribution, l’hypothèse alternative est rejetée. Par contre, si la statistique de test est supérieure à la valeur critique de la distribution, l’hypothèse nulle est rejetée.