Как выполнить двухпропорциональный z-тест в sas
Двухпропорциональный z-критерий используется для определения наличия статистически значимой разницы между двумя долями населения.
В этом тесте используется следующая нулевая гипотеза:
- H 0 : μ 1 = μ 2 (две пропорции населения равны)
Альтернативная гипотеза может быть двусторонней, левой или правой:
- H 1 (двусторонний): π 1 ≠ π 2 (две пропорции населения не равны)
- H 1 (слева): π 1 < π 2 (доля населения 1 меньше доли населения 2)
- H 1 (справа): π 1 > π 2 (доля населения 1 больше, чем доля населения 2)
Мы используем следующую формулу для расчета статистики z-теста:
z = (p 1 -p 2 ) / √ p(1-p)(1/n 1 +1/n 2 )
где p 1 и p 2 — доли выборки, n 1 и n 2 — размеры выборки, и где p — общая объединенная доля, рассчитанная следующим образом:
р = (п 1 п 1 + п 2 п 2 )/(п 1 + п 2 )
Если значение p, соответствующее статистике z-теста, меньше выбранного уровня значимости (обычные варианты — 0,10, 0,05 и 0,01), то вы можете отклонить нулевую гипотезу.
В следующем примере показано, как выполнить двухпропорциональный z-тест в SAS.
Пример: тест на две пропорции Z в SAS
Предположим, мы хотим знать, существует ли разница между долей жителей, поддерживающих определенный закон в округе А, и долей жителей, поддерживающих закон в округе Б.
Чтобы проверить это, мы собираем случайную выборку из 50 жителей каждого округа и подсчитываем, сколько из них поддерживают закон.
Следующий код показывает, как создать набор данных, суммирующий количество жителей, поддерживающих закон в каждом округе:
/*create dataset*/ data my_data; input county $status $count; datalines ; A Bracket 34 A Reject 16 B Bracket 29 B Reject 21 ; run ; /*view dataset*/ proc print data =my_data;
Затем мы можем использовать оператор PROC FREQ с опцией Riskdiff (равен var = null) для выполнения двухпропорционального z-теста:
/*perform two proportion z-test*/
proc freq data =my_data;
weightcount ;
county tables * status / riskdiff ( equal var = null);
run ;
В таблице «Тест разницы рисков в таблице результатов» мы можем увидеть следующую информацию:
- Статистика Z-теста: -1,0356
- Двустороннее значение p: 0,3004.
В этом конкретном двухпропорциональном z-тесте использовались следующие предположения:
- H 0 : π 1 = π 2 (две пропорции населения равны)
- H 1 : π 1 ≠ π 2 (две пропорции населения не равны)
Поскольку значение p в выходных данных не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.
Это означает, что у нас нет достаточных доказательств, чтобы утверждать, что доля жителей, поддерживающих этот закон, в двух округах разная.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные статистические тесты в SAS:
Как выполнить одновыборочный t-тест в SAS
Как выполнить t-тест с двумя выборками в SAS
Как выполнить t-тест парных выборок в SAS