Test d’adéquation
Cet article explique ce qu’est un test d’adéquation et à quoi il sert dans les statistiques. Il montre également comment effectuer un test d’ajustement et, en outre, vous pourrez voir un exercice résolu étape par étape.
Qu’est-ce qu’un test d’adéquation ?
Le test d’adéquation est un test statistique qui nous permet de déterminer si un échantillon de données correspond ou non à une certaine distribution de probabilité . Autrement dit, le test d’adéquation sert à vérifier si les données observées correspondent aux données attendues.
Fréquemment, nous essayons de faire des prédictions sur un phénomène et, par conséquent, nous avons attendu des valeurs sur ledit phénomène qui, selon nous, se produiront. Cependant, nous devons ensuite collecter les données et vérifier si les données collectées correspondent bien à nos attentes. Ainsi, les tests d’adéquation nous permettent de décider à l’aide d’un critère statistique si les données attendues et les données observées sont similaires ou non.
Ainsi le test d’ajustement est un test d’hypothèse dont l’hypothèse nulle est que les valeurs observées sont égales aux valeurs attendues, par contre, l’hypothèse alternative du test indique que les valeurs observées sont statistiquement différentes des valeurs attendues.
En statistique, le test d’adéquation de l’ajustement est également connu sous le nom de test du chi carré , puisque la distribution de référence du test est la distribution du chi carré.
Formule de test d’adéquation
La statistique du test d’adéquation est égale à la somme des carrés des différences entre les valeurs observées et les valeurs attendues divisée par les valeurs attendues.
Ainsi, la formule du test d’adéquation est la suivante :
Où:
- est la statistique du test d’adéquation de l’ajustement, qui suit une distribution du chi carré avec degrés de liberté.
- est la taille de l’échantillon de données.
- est la valeur observée pour les données i.
- est la valeur attendue pour les données i.
Ainsi, étant donné un niveau de signification
, la statistique de test calculée doit être comparée à la valeur critique du test pour déterminer s’il faut rejeter l’hypothèse nulle ou l’hypothèse alternative du test d’hypothèse :
- Si la statistique du test est inférieure à la valeur critique , l’hypothèse alternative est rejetée (et l’hypothèse nulle est acceptée).
- Si la statistique du test est supérieure à la valeur critique , l’hypothèse nulle est rejetée (et l’hypothèse alternative est acceptée).
Comment faire un test d’ajustement
Pour effectuer un test d’adéquation, les étapes suivantes doivent être suivies :
- Nous établissons d’abord l’hypothèse nulle et l’hypothèse alternative du test d’adéquation.
- Deuxièmement, nous choisissons le niveau de confiance , et donc le niveau de signification , du test d’adéquation.
- Ensuite, nous calculons la statistique du test d’adéquation, dont la formule se trouve dans la section ci-dessus.
- Nous trouvons la valeur critique du test d’adéquation de l’ajustement à l’aide du tableau de distribution du chi carré.
- Nous comparons la statistique du test avec la valeur critique :
- Si la statistique du test est inférieure à la valeur critique, l’hypothèse alternative est rejetée (et l’hypothèse nulle est acceptée).
- Si la statistique du test est supérieure à la valeur critique, l’hypothèse nulle est rejetée (et l’hypothèse alternative est acceptée).
Exemple de test d’adéquation
- La propriétaire d’un magasin affirme que 50 % de ses ventes concernent le produit A, 35 % de ses ventes concernent le produit B et 15 % de ses ventes concernent le produit C. Cependant, les unités vendues de chaque produit sont celles qui sont indiqué dans le tableau suivant. Analysez si les données théoriques du propriétaire sont statistiquement différentes des données réelles collectées.
Produit | Ventes observées (O i ) |
---|---|
Produit A | 453 |
Produit B | 268 |
Produit C | 79 |
Total | 800 |
Pour déterminer si les valeurs observées sont équivalentes aux valeurs attendues, nous effectuerons un test d’adéquation. L’hypothèse nulle et l’hypothèse alternative du test sont :
Dans ce cas, nous utiliserons un niveau de confiance de 95 % pour le test, le niveau de signification sera donc de 5 %.
Pour connaître les valeurs des ventes attendues, nous devons multiplier le pourcentage des ventes attendues de chaque produit par le nombre de ventes totales réalisées :
Par conséquent, le tableau de fréquence du problème est le suivant :
Produit | Ventes observées (O i ) | Ventes attendues (E i ) |
---|---|---|
Produit A | 453 | 400 |
Produit B | 268 | 280 |
Produit C | 79 | 120 |
Total | 800 | 800 |
Maintenant que nous avons calculé toutes les valeurs, nous appliquons la formule du test du chi carré pour calculer la statistique du test :
Une fois la valeur de la statistique du test calculée, nous utilisons le tableau de distribution du chi carré pour trouver la valeur critique du test. La distribution du chi carré a
degrés de liberté et le niveau de signification est , pourtant:
Ainsi, la statistique du test (21,53) est supérieure à la valeur critique du test (5,991), donc l’hypothèse nulle est rejetée et l’hypothèse alternative est acceptée. Cela signifie que les données sont très différentes et que le propriétaire du magasin s’attendait donc à des ventes différentes de celles réellement réalisées.