Comment effectuer un test d’ajustement du chi carré dans R
Un test d’ajustement du chi carré est utilisé pour déterminer si une variable catégorielle suit ou non une distribution hypothétique.
Ce didacticiel explique comment effectuer un test d’ajustement du chi carré dans R.
Exemple : test d’adéquation du chi carré dans R
Un propriétaire de magasin affirme qu’un nombre égal de clients viennent dans son magasin chaque jour de la semaine. Pour tester cette hypothèse, un chercheur enregistre le nombre de clients qui viennent dans le magasin au cours d’une semaine donnée et trouve ce qui suit :
- Lundi : 50 clients
- Mardi : 60 clients
- Mercredi : 40 clients
- Jeudi : 47 clients
- Vendredi : 53 clients
Suivez les étapes suivantes pour effectuer un test d’ajustement du chi carré dans R afin de déterminer si les données sont cohérentes avec l’affirmation du propriétaire du magasin.
Étape 1 : Créez les données.
Tout d’abord, nous allons créer deux tableaux pour contenir nos fréquences observées et notre proportion attendue de clients pour chaque jour :
observed <- c(50, 60, 40, 47, 53)
expected <- c(.2, .2, .2, .2, .2) #must add up to 1
Étape 2 : Effectuez le test d’adéquation du chi carré.
Ensuite, nous pouvons effectuer le test d’ajustement du chi carré à l’aide de la fonction chisq.test() , qui utilise la syntaxe suivante :
chisq.test(x, p)
où:
- x : Un vecteur numérique des fréquences observées.
- p : Un vecteur numérique de proportions attendues.
Le code suivant montre comment utiliser cette fonction dans notre exemple :
#perform Chi-Square Goodness of Fit Test
chisq.test(x=observed, p=expected)
Chi-squared test for given probabilities
data: observed
X-squared = 4.36, df = 4, p-value = 0.3595
La statistique du test du Chi carré est de 4,36 et la valeur p correspondante est de 0,3595 .
Notez que la valeur p correspond à une valeur du Chi carré avec n-1 degrés de liberté (dof), où n est le nombre de catégories différentes. Dans ce cas, ddl = 5-1 = 4.
Vous pouvez utiliser le calculateur du chi carré vers la valeur P pour confirmer que la valeur p qui correspond à X 2 = 4,36 avec ddl = 4 est 0,35947 .
Rappelons qu’un test d’adéquation du chi carré utilise les hypothèses nulles et alternatives suivantes :
- H 0 : (hypothèse nulle) Une variable suit une distribution hypothétique.
- H 1 : (hypothèse alternative) Une variable ne suit pas une distribution hypothétique.
Puisque la valeur p (0,35947) n’est pas inférieure à 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle. Cela signifie que nous n’avons pas suffisamment de preuves pour affirmer que la véritable répartition des clients est différente de celle déclarée par le propriétaire du magasin.
Ressources additionnelles
Comment effectuer un test d’indépendance du chi carré dans R
Comment calculer la valeur P d’une statistique du chi carré dans R
Comment trouver la valeur critique du chi carré dans R