Comment effectuer le test de McNemar dans R
Le test de McNemar est utilisé pour déterminer s’il existe une différence statistiquement significative dans les proportions entre les données appariées.
Ce didacticiel explique comment effectuer le test de McNemar dans R.
Exemple : test de McNemar dans R
Supposons que les chercheurs souhaitent savoir si une certaine vidéo marketing peut changer l’opinion des gens sur une loi particulière. Ils interrogent 100 personnes pour savoir si elles soutiennent ou non la loi. Ensuite, ils montrent la vidéo marketing aux 100 personnes et les interrogent à nouveau une fois la vidéo terminée.
Le tableau suivant montre le nombre total de personnes qui ont soutenu la loi avant et après avoir visionné la vidéo :
Vidéo avant le marketing | ||
---|---|---|
Vidéo après le marketing | Soutien | Ne supporte pas |
Soutien | 30 | 40 |
Ne supporte pas | 12 | 18 |
Pour déterminer s’il y avait une différence statistiquement significative dans la proportion de personnes qui soutenaient la loi avant et après le visionnage de la vidéo, nous pouvons effectuer le test de McNemar.
Étape 1 : Créez les données.
Tout d’abord, créez l’ensemble de données sous forme matricielle.
#create data data <- matrix(c(30, 12, 40, 18), nrow = 2, dimnames = list("After Video" = c("Support", "Do Not Support"), "Before Video" = c("Support", "Do Not Support"))) #view data data Before Video After Video Support Do Not Support Support 30 40 Do Not Support 12 18
Étape 2 : Effectuez le test de McNemar.
Ensuite, effectuez le test de McNemar en utilisant la syntaxe suivante :
mcnemar.test (x, y = NULL, correct = VRAI)
où:
- x : soit un tableau de contingence bidimensionnel sous forme matricielle, soit un objet facteur.
- y : un objet facteur ; ignoré si x est une matrice.
- correct : TRUE = appliquer une correction de continuité lors du calcul des statistiques de test ; FAUX = ne pas appliquer de correction de continuité.
En général, une correction de continuité doit être appliquée lorsque certains comptes du tableau sont faibles. En règle générale, cette correction est généralement appliquée lorsque le nombre de cellules est inférieur à 5.
Nous effectuerons le test de McNemar avec et sans correction de continuité, juste pour illustrer les différences :
#Perform McNemar's Test with continuity correction mcnemar.test(data) McNemar's Chi-squared test with continuity correction data: data McNemar's chi-squared = 14.019, df = 1, p-value = 0.000181 #Perform McNemar's Test without continuity correction mcnemar.test(data, correct=FALSE) McNemar's Chi-squared test data: data McNemar's chi-squared = 15.077, df = 1, p-value = 0.0001032
Dans les deux cas, la valeur p du test est inférieure à 0,05, nous rejetterions donc l’hypothèse nulle et conclurions que la proportion de personnes qui soutenaient la loi avant et après avoir regardé la vidéo marketing était statistiquement différente.