Hoe u een z-test met twee proporties uitvoert in excel


Een z-test met twee proporties wordt gebruikt om te testen op een verschil tussen twee populatieproporties.

Stel bijvoorbeeld dat een directeur van een schooldistrict beweert dat het percentage leerlingen dat chocolademelk verkiest boven gewone melk in schoolkantines hetzelfde is voor School 1 en School 2.

Om deze bewering te testen, neemt een onafhankelijke onderzoeker een eenvoudige willekeurige steekproef van 100 leerlingen van elke school en vraagt hen naar hun voorkeuren. Hij merkt op dat 70% van de leerlingen chocolademelk verkiest op school 1 en 68% van de leerlingen chocolademelk verkiest op school 2.

We kunnen een z-test met twee proporties gebruiken om te testen of het percentage leerlingen dat chocolademelk verkiest boven gewone melk op beide scholen hetzelfde is.

Stappen voor het uitvoeren van een Z-test met twee monsters

We kunnen de volgende stappen gebruiken om de z-test met twee proporties uit te voeren:

Stap 1. Formuleer de hypothesen.

De nulhypothese (H0): P 1 = P 2

De alternatieve hypothese: (Ha): P 1 ≠ P 2

Stap 2. Zoek de teststatistiek en de bijbehorende p-waarde.

Zoek eerst de gepoolde steekproefaandeel p:

p = (p 1 * n 1 + p 2 * n 2 ) / (n 1 + n 2 )

p = (0,70*100 + 0,68*100) / (100 + 100) = 0,69

Gebruik vervolgens p in de volgende formule om de z-teststatistiek te vinden:

z = (p 1 -p 2 ) / √p * (1-p) * [ (1/n 1 ) + (1/n 2 )]

z = (.70-.68) / √.69 * (1-.69) * [(1/100) + (1/100)] = .02 / .0654 = .306

Gebruik de P-waarde Z-score-calculator met een az-score van 0,306 en een tweezijdige test om te ontdekken dat de p-waarde = 0,759 .

Stap 3. Verwerp de nulhypothese of verwerp deze niet.

Eerst moeten we een significantieniveau kiezen dat we voor de test willen gebruiken. Veel voorkomende keuzes zijn 0,01, 0,05 en 0,10. Laten we voor dit voorbeeld 0,05 gebruiken. Omdat de p-waarde niet minder is dan ons significantieniveau van 0,05, slagen we er niet in de nulhypothese te verwerpen.

We hebben dus niet voldoende bewijs om te zeggen dat het percentage leerlingen dat de voorkeur geeft aan melk boven chocolade verschillend is voor School 1 en School 2.

Hoe u een Z-test met twee monsters uitvoert in Excel

De volgende voorbeelden illustreren hoe u een z-test met twee steekproeven uitvoert in Excel.

Z-test met twee monsters (tweezijdig)

Een directeur van een schooldistrict zegt dat het percentage leerlingen dat chocolademelk verkiest boven gewone melk in schoolkantines hetzelfde is voor School 1 en School 2.

Om deze bewering te testen, neemt een onafhankelijke onderzoeker een eenvoudige willekeurige steekproef van 100 leerlingen van elke school en vraagt hen naar hun voorkeuren. Hij merkt op dat 70% van de leerlingen chocolademelk verkiest op school 1 en 68% van de leerlingen chocolademelk verkiest op school 2.

Kunnen we op basis van deze resultaten de bewering van de directeur verwerpen dat het percentage leerlingen dat de voorkeur geeft aan melk boven chocolade hetzelfde is voor School 1 en School 2? Gebruik een significantieniveau van 0,05.

De volgende schermafbeelding laat zien hoe u een tweezijdige z-test met twee steekproeven uitvoert in Excel, samen met de gebruikte formules:

U moet de waarden in cellen B1:B4 invullen. Vervolgens worden de waarden in de cellen B6:B8 automatisch berekend met behulp van de formules die worden weergegeven in de cellen C6:C8 .

Houd er rekening mee dat de weergegeven formules het volgende doen:

  • Formule in cel C6 : Hiermee wordt het samengevoegde monsteraandeel berekend met behulp van de formule p = (p 1 * n 1 + p 2 * n 2 ) / (n 1 + n 2 )
  • Formule in cel C7 : Dit berekent de z- teststatistiek met behulp van de formule z = (p 1 -p 2 ) / √p * (1-p) * [ (1/n 1 ) + (1/n 2 ) ] waarbij p is het aandeel van het samengevoegde monster.
  • Formule in cel C8 : Hiermee wordt de p-waarde berekend die is gekoppeld aan de teststatistiek berekend in cel B7 met behulp van de Excel-functie NORM.S.DIST , die de cumulatieve waarschijnlijkheid voor de normale verdeling retourneert met gemiddelde = 0 en standaarddeviatie = 1. We vermenigvuldig deze waarde met twee, aangezien dit een tweezijdige test is.

Omdat de p-waarde ( 0,759 ) niet kleiner is dan het gekozen significantieniveau van 0,05 , slagen we er niet in de nulhypothese te verwerpen. We hebben dus niet voldoende bewijs om te zeggen dat het percentage leerlingen dat de voorkeur geeft aan melk boven chocolade verschillend is voor School 1 en School 2.

Z-test met twee monsters (eenzijdig)

Een directeur van een schooldistrict zegt dat het percentage leerlingen dat chocolademelk verkiest boven gewone melk op school 1 kleiner is dan of gelijk is aan het percentage op school 2.

Om deze bewering te testen, neemt een onafhankelijke onderzoeker een eenvoudige willekeurige steekproef van 100 leerlingen van elke school en vraagt hen naar hun voorkeuren. Hij merkt op dat 70% van de leerlingen chocolademelk verkiest op school 1 en 68% van de leerlingen chocolademelk verkiest op school 2.

Kunnen we, in het licht van deze resultaten, de bewering van de hoofdinspecteur verwerpen dat het percentage leerlingen dat de voorkeur geeft aan chocolademelk op school 1 kleiner is dan of gelijk is aan dat op school 2? Gebruik een significantieniveau van 0,05.

De volgende schermafbeelding laat zien hoe u een eenzijdige z-test met twee steekproeven uitvoert in Excel, samen met de gebruikte formules:

U moet de waarden in cellen B1:B4 invullen. Vervolgens worden de waarden in de cellen B6:B8 automatisch berekend met behulp van de formules die worden weergegeven in de cellen C6:C8 .

Houd er rekening mee dat de weergegeven formules het volgende doen:

  • Formule in cel C6 : Hiermee wordt het samengevoegde monsteraandeel berekend met behulp van de formule p = (p 1 * n 1 + p 2 * n 2 ) / (n 1 + n 2 )
  • Formule in cel C7 : Dit berekent de z- teststatistiek met behulp van de formule z = (p 1 -p 2 ) / √p * (1-p) * [ (1/n 1 ) + (1/n 2 ) ] waarbij p is het aandeel van het samengevoegde monster.
  • Formule in cel C8 : Hiermee wordt de p-waarde berekend die is gekoppeld aan de teststatistiek berekend in cel B7 met behulp van de Excel-functie NORM.S.DIST , die de cumulatieve waarschijnlijkheid van de normale verdeling retourneert met gemiddelde = 0 en standaarddeviatie = 1.

Omdat de p-waarde ( 0,379 ) niet kleiner is dan het gekozen significantieniveau van 0,05 , slagen we er niet in de nulhypothese te verwerpen. We hebben dus niet genoeg bewijs om te zeggen dat het percentage leerlingen dat op school 2 de voorkeur geeft aan chocolademelk hoger is dan dat op school 1.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert