Hoe u een z-test met twee proporties uitvoert in sas
Een z-test met twee proporties wordt gebruikt om te bepalen of er een statistisch significant verschil bestaat tussen twee populatieproporties.
Deze test maakt gebruik van de volgende nulhypothese:
- H 0 : μ 1 = μ 2 (de twee populatieverhoudingen zijn gelijk)
De alternatieve hypothese kan bilateraal, links of rechts zijn:
- H 1 (tweezijdig): π 1 ≠ π 2 (de twee populatieverhoudingen zijn niet gelijk)
- H 1 (links): π 1 < π 2 (het aandeel van bevolking 1 is kleiner dan het aandeel van bevolking 2)
- H 1 (rechts): π 1 > π 2 (het aandeel van bevolking 1 is groter dan het aandeel van bevolking 2)
We gebruiken de volgende formule om de z-teststatistiek te berekenen:
z = (p 1 -p 2 ) / √ p(1-p)(1/n 1 +1/n 2 )
waarbij p 1 en p 2 de steekproefverhoudingen zijn, n 1 en n 2 de steekproefomvang zijn, en waarbij p het totale gepoolde aandeel is, als volgt berekend:
p = (p 1 n 1 + p 2 n 2 )/(n 1 + n 2 )
Als de p-waarde die overeenkomt met de z-teststatistiek kleiner is dan het gekozen significantieniveau (veel voorkomende keuzes zijn 0,10, 0,05 en 0,01), dan kun je de nulhypothese verwerpen.
In het volgende voorbeeld ziet u hoe u een z-test met twee proporties uitvoert in SAS.
Voorbeeld: Z-test met twee proporties in SAS
Stel dat we willen weten of er een verschil is tussen het aandeel inwoners dat een bepaalde wet in County A steunt, en het aandeel dat de wet in County B steunt.
Om dit te testen, verzamelen we een willekeurige steekproef van 50 inwoners uit elke provincie en tellen we hoeveel inwoners de wet steunen.
De volgende code laat zien hoe u een gegevensset kunt maken met een samenvatting van het aantal inwoners dat de wet in elke provincie ondersteunt:
/*create dataset*/ data my_data; input county $status $count; datalines ; A Bracket 34 A Reject 16 B Bracket 29 B Reject 21 ; run ; /*view dataset*/ proc print data =my_data;
We kunnen dan de PROC FREQ- instructie gebruiken met de optie Riskdiff (equal var = null) om de z-test met twee proporties uit te voeren:
/*perform two proportion z-test*/
proc freq data =my_data;
weightcount ;
county tables * status / riskdiff ( equal var = null);
run ;
Uit de tabel Risicoverschiltest in resultaat kunnen we de volgende informatie zien:
- Z-teststatistiek: -1,0356
- Tweezijdige p-waarde: 0,3004
Deze specifieke z-test met twee proporties maakte gebruik van de volgende aannames:
- H 0 : π 1 = π 2 (de twee populatieverhoudingen zijn gelijk)
- H 1 : π 1 ≠ π 2 (de twee populatieverhoudingen zijn niet gelijk)
Omdat de p-waarde in de output niet kleiner is dan 0,05, slagen we er niet in de nulhypothese te verwerpen.
Dit betekent dat we niet voldoende bewijs hebben om te zeggen dat het aandeel inwoners dat deze wet steunt, verschillend is tussen de twee provincies.
Aanvullende bronnen
In de volgende zelfstudies wordt uitgelegd hoe u andere algemene statistische tests in SAS kunt uitvoeren:
Hoe u een t-test met één monster uitvoert in SAS
Hoe u een t-test met twee steekproeven uitvoert in SAS
Een t-test met gepaarde monsters uitvoeren in SAS