Как выполнить двухпропорциональный z-тест в sas


Двухпропорциональный z-критерий используется для определения наличия статистически значимой разницы между двумя долями населения.

В этом тесте используется следующая нулевая гипотеза:

  • H 0 : μ 1 = μ 2 (две пропорции населения равны)

Альтернативная гипотеза может быть двусторонней, левой или правой:

  • H 1 (двусторонний): π 1 ≠ π 2 (две пропорции населения не равны)
  • H 1 (слева): π 1 < π 2 (доля населения 1 меньше доли населения 2)
  • H 1 (справа): π 1 > π 2 (доля населения 1 больше, чем доля населения 2)

Мы используем следующую формулу для расчета статистики z-теста:

z = (p 1 -p 2 ) / √ p(1-p)(1/n 1 +1/n 2 )

где p 1 и p 2 — доли выборки, n 1 и n 2 — размеры выборки, и где p — общая объединенная доля, рассчитанная следующим образом:

р = (п 1 п 1 + п 2 п 2 )/(п 1 + п 2 )

Если значение p, соответствующее статистике z-теста, меньше выбранного уровня значимости (обычные варианты — 0,10, 0,05 и 0,01), то вы можете отклонить нулевую гипотезу.

В следующем примере показано, как выполнить двухпропорциональный z-тест в SAS.

Пример: тест на две пропорции Z в SAS

Предположим, мы хотим знать, существует ли разница между долей жителей, поддерживающих определенный закон в округе А, и долей жителей, поддерживающих закон в округе Б.

Чтобы проверить это, мы собираем случайную выборку из 50 жителей каждого округа и подсчитываем, сколько из них поддерживают закон.

Следующий код показывает, как создать набор данных, суммирующий количество жителей, поддерживающих закон в каждом округе:

 /*create dataset*/
data my_data;
    input county $status $count;
    datalines ;
A Bracket 34
A Reject 16
B Bracket 29
B Reject 21
;
run ;

/*view dataset*/
proc print data =my_data;

Затем мы можем использовать оператор PROC FREQ с опцией Riskdiff (равен var = null) для выполнения двухпропорционального z-теста:

 /*perform two proportion z-test*/
proc freq data =my_data;
    weightcount ;
    county tables * status / riskdiff ( equal var = null);
run ; 

двухпропорциональный z-тест в SAS

В таблице «Тест разницы рисков в таблице результатов» мы можем увидеть следующую информацию:

  • Статистика Z-теста: -1,0356
  • Двустороннее значение p: 0,3004.

В этом конкретном двухпропорциональном z-тесте использовались следующие предположения:

  • H 0 : π 1 = π 2 (две пропорции населения равны)
  • H 1 : π 1 ≠ π 2 (две пропорции населения не равны)

Поскольку значение p в выходных данных не меньше 0,05, мы не можем отвергнуть нулевую гипотезу.

Это означает, что у нас нет достаточных доказательств, чтобы утверждать, что доля жителей, поддерживающих этот закон, в двух округах разная.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные статистические тесты в SAS:

Как выполнить одновыборочный t-тест в SAS
Как выполнить t-тест с двумя выборками в SAS
Как выполнить t-тест парных выборок в SAS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *