Test d’indépendance du chi carré dans R (avec exemples)
Un test d’indépendance du chi carré est utilisé pour déterminer s’il existe ou non une association significative entre deux variables catégorielles .
Ce didacticiel explique comment effectuer un test d’indépendance du chi carré dans R.
Exemple : test du chi carré d’indépendance dans R
Supposons que nous voulions savoir si le genre est associé ou non à la préférence pour un parti politique. Nous prenons un échantillon aléatoire simple de 500 électeurs et les interrogeons sur leur préférence en matière de parti politique. Le tableau suivant présente les résultats de l’enquête :
Républicain | Démocrate | Indépendant | Total | |
Mâle | 120 | 90 | 40 | 250 |
Femelle | 110 | 95 | 45 | 250 |
Total | 230 | 185 | 85 | 500 |
Suivez les étapes suivantes pour effectuer un test d’indépendance du chi carré dans R afin de déterminer si le sexe est associé à la préférence du parti politique.
Étape 1 : Créez les données.
Tout d’abord, nous allons créer un tableau pour contenir nos données :
#create table data <- matrix(c(120, 90, 40, 110, 95, 45), ncol=3, byrow=TRUE) colnames(data) <- c("Rep","Dem","Ind") rownames(data) <- c("Male","Female") data <- as.table(data) #view table data Rep Dem Ind Male 120 90 40 Female 110 95 45
Étape 2 : Effectuez le test d’indépendance du chi carré.
Ensuite, nous pouvons effectuer le test d’indépendance du chi carré en utilisant la fonction chisq.test() :
#Perform Chi-Square Test of Independence
chisq.test(data)
Pearson's Chi-squared test
data: data
X-squared = 0.86404, df = 2, p-value = 0.6492
La façon d’interpréter le résultat est la suivante :
- Statistique du test du chi carré : 0,86404
- Degrés de liberté : 2 (calculé comme #rows-1 * #columns-1)
- Valeur p : 0,6492
Rappelons que le test d’indépendance du chi carré utilise les hypothèses nulles et alternatives suivantes :
- H 0 : (hypothèse nulle) Les deux variables sont indépendantes.
- H 1 : (hypothèse alternative) Les deux variables ne sont pas indépendantes.
Puisque la valeur p (0,6492) du test n’est pas inférieure à 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle. Cela signifie que nous ne disposons pas de preuves suffisantes pour affirmer qu’il existe une association entre le sexe et les préférences en matière de parti politique.
En d’autres termes, le sexe et les préférences en matière de parti politique sont indépendants.
Ressources additionnelles
Une introduction au test d’indépendance du chi carré
Calculateur du test du chi carré d’indépendance
Comment calculer la valeur P d’une statistique du chi carré dans R
Comment trouver la valeur critique du chi carré dans R