Comment effectuer un test Z à deux proportions dans Excel
Un test z à deux proportions est utilisé pour tester une différence entre deux proportions de population.
Par exemple, supposons qu’un directeur d’un district scolaire affirme que le pourcentage d’élèves qui préfèrent le lait au chocolat au lait ordinaire dans les cafétérias scolaires est le même pour l’école 1 et l’école 2.
Pour tester cette affirmation, un chercheur indépendant obtient un échantillon aléatoire simple de 100 élèves de chaque école et les interroge sur leurs préférences. Il constate que 70 % des élèves préfèrent le lait chocolaté en école 1 et 68 % des élèves préfèrent le lait chocolaté en école 2.
Nous pouvons utiliser un test z à deux proportions pour vérifier si le pourcentage d’élèves qui préfèrent le lait au chocolat au lait ordinaire est le même dans les deux écoles.
Étapes pour effectuer un test Z à deux échantillons
Nous pouvons utiliser les étapes suivantes pour effectuer le test z à deux proportions :
Étape 1. Énoncez les hypothèses.
L’hypothèse nulle (H0) : P 1 = P 2
L’hypothèse alternative : (Ha) : P 1 ≠ P 2
Étape 2. Recherchez la statistique du test et la valeur p correspondante.
Tout d’abord, trouvez la proportion de l’échantillon regroupé p :
p = (p 1 * n 1 + p 2 * n 2 ) / (n 1 + n 2 )
p = (0,70*100 + 0,68*100) / (100 + 100) = 0,69
Utilisez ensuite p dans la formule suivante pour trouver la statistique de test z :
z = (p 1 -p 2 ) / √p * (1-p) * [ (1/n 1 ) + (1/n 2 )]
z = (.70-.68) / √.69 * (1-.69) * [ (1/100) + (1/100)] = .02 / .0654 = .306
Utilisez lecalculateur de score Z à valeur P avec un score az de 0,306 et un test bilatéral pour constater que la valeur p = 0,759 .
Étape 3. Rejetez ou ne rejetez pas l’hypothèse nulle.
Tout d’abord, nous devons choisir un niveau de signification à utiliser pour le test. Les choix courants sont 0,01, 0,05 et 0,10. Pour cet exemple, utilisons 0,05. Étant donné que la valeur p n’est pas inférieure à notre niveau de signification de 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle.
Ainsi, nous ne disposons pas de preuves suffisantes pour affirmer que le pourcentage d’élèves préférant le lait au chocolat est différent pour l’école 1 et l’école 2.
Comment effectuer un test Z à deux échantillons dans Excel
Les exemples suivants illustrent comment effectuer un test z à deux échantillons dans Excel.
Test Z à deux échantillons (bilatéral)
Un directeur d’un district scolaire affirme que le pourcentage d’élèves qui préfèrent le lait au chocolat au lait ordinaire dans les cafétérias scolaires est le même pour l’école 1 et l’école 2.
Pour tester cette affirmation, un chercheur indépendant obtient un échantillon aléatoire simple de 100 élèves de chaque école et les interroge sur leurs préférences. Il constate que 70 % des élèves préfèrent le lait chocolaté en école 1 et 68 % des élèves préfèrent le lait chocolaté en école 2.
Sur la base de ces résultats, peut-on rejeter l’affirmation du surintendant selon laquelle le pourcentage d’élèves préférant le lait au chocolat est le même pour l’école 1 et l’école 2 ? Utilisez un niveau de signification de 0,05.
La capture d’écran suivante montre comment effectuer un test z bilatéral à deux échantillons dans Excel, ainsi que les formules utilisées :
Vous devez remplir les valeurs des cellules B1:B4 . Ensuite, les valeurs des cellules B6:B8 sont automatiquement calculées à l’aide des formules affichées dans les cellules C6:C8 .
Notez que les formules affichées effectuent les opérations suivantes :
- Formule dans la cellule C6 : Ceci calcule la proportion de l’échantillon regroupé en utilisant la formule p = (p 1 * n 1 + p 2 * n 2 ) / (n 1 + n 2 )
- Formule dans la cellule C7 : Ceci calcule la statistique de test z en utilisant la formule z = (p 1 -p 2 ) / √p * (1-p) * [ (1/n 1 ) + (1/n 2 )] où p est la proportion de l’échantillon regroupé.
- Formule dans la cellule C8 : Ceci calcule la valeur p associée à la statistique de test calculée dans la cellule B7 à l’aide de la fonction Excel NORM.S.DIST , qui renvoie la probabilité cumulée pour la distribution normale avec moyenne = 0 et écart type = 1. Nous multipliez cette valeur par deux puisqu’il s’agit d’un test bilatéral.
Étant donné que la valeur p ( 0,759 ) n’est pas inférieure au niveau de signification choisi de 0,05 , nous ne parvenons pas à rejeter l’hypothèse nulle. Ainsi, nous ne disposons pas de preuves suffisantes pour affirmer que le pourcentage d’élèves préférant le lait au chocolat est différent pour l’école 1 et l’école 2.
Test Z à deux échantillons (unilatéral)
Un directeur d’un district scolaire affirme que le pourcentage d’élèves qui préfèrent le lait au chocolat au lait ordinaire à l’école 1 est inférieur ou égal au pourcentage de l’école 2.
Pour tester cette affirmation, un chercheur indépendant obtient un échantillon aléatoire simple de 100 élèves de chaque école et les interroge sur leurs préférences. Il constate que 70 % des élèves préfèrent le lait chocolaté en école 1 et 68 % des élèves préfèrent le lait chocolaté en école 2.
À la lumière de ces résultats, peut-on rejeter l’affirmation du surintendant selon laquelle le pourcentage d’élèves préférant le lait chocolaté à l’école 1 est inférieur ou égal à celui de l’école 2 ? Utilisez un niveau de signification de 0,05.
La capture d’écran suivante montre comment effectuer un test z unilatéral à deux échantillons dans Excel, ainsi que les formules utilisées :
Vous devez remplir les valeurs des cellules B1:B4 . Ensuite, les valeurs des cellules B6:B8 sont automatiquement calculées à l’aide des formules affichées dans les cellules C6:C8 .
Notez que les formules affichées effectuent les opérations suivantes :
- Formule dans la cellule C6 : Ceci calcule la proportion de l’échantillon regroupé en utilisant la formule p = (p 1 * n 1 + p 2 * n 2 ) / (n 1 + n 2 )
- Formule dans la cellule C7 : Ceci calcule la statistique de test z en utilisant la formule z = (p 1 -p 2 ) / √p * (1-p) * [ (1/n 1 ) + (1/n 2 )] où p est la proportion de l’échantillon regroupé.
- Formule dans la cellule C8 : ceci calcule la valeur p associée à la statistique de test calculée dans la cellule B7 à l’aide de la fonction Excel NORM.S.DIST , qui renvoie la probabilité cumulée de la distribution normale avec moyenne = 0 et écart type = 1.
Étant donné que la valeur p ( 0,379 ) n’est pas inférieure au niveau de signification choisi de 0,05 , nous ne parvenons pas à rejeter l’hypothèse nulle. Ainsi, nous n’avons pas suffisamment de preuves pour affirmer que le pourcentage d’élèves préférant le lait chocolaté à l’école 2 est supérieur à celui de l’école 1.