Как рассчитать баллы z в sas


В статистике z-показатель говорит нам, на сколько стандартных отклонений значение находится от среднего значения .

Для расчета z-показателя мы используем следующую формулу:

z = (X – µ)/σ

Золото:

  • X — одно значение необработанных данных.
  • μ — среднее значение набора данных
  • σ — стандартное отклонение набора данных

В следующем примере показано, как рассчитать z-показатели для значений необработанных данных в SAS.

Пример: расчет Z-показателей в SAS

Предположим, мы создаем следующий набор данных в SAS:

 /*create dataset*/
data original_data;
    input values;
    datalines ;
7
12
14
12
16
18
6
7
14
17
19
22
24
13
17
12
;
run ;

/*view dataset*/
proc print data = original_data;

Теперь предположим, что мы хотим вычислить z-показатель для каждого значения в наборе данных.

Для этого мы можем использовать proc sql :

 /*create new variable that shows z-scores for each raw data value*/
proc sql ;
    select values, (values - mean(values)) / std(values) as z_scores
    from original_data;
quit ; 

z баллов в SAS

В столбце значений отображаются исходные значения данных, а в столбце z_scores отображается z-оценка для каждого значения.

Как интерпретировать показатели Z в SAS

Z-показатель говорит нам, на сколько стандартных отклонений значение отличается от среднего.

Показатель z может быть положительным, отрицательным или нулевым.

Положительный показатель z указывает на то, что определенное значение выше среднего, отрицательный показатель z указывает на то, что определенное значение ниже среднего, а нулевой показатель az указывает на то, что конкретное значение равно среднему.

Если бы мы вычислили среднее и стандартное отклонение нашего набора данных, мы бы обнаружили, что среднее значение составляет 14,375 , а стандартное отклонение — 5,162 .

Итак, первое значение в нашем наборе данных было 7, которое имело z-показатель (7-14,375) / 5,162 = -1,428 . Это означает, что значение «7» на 1,428 стандартных отклонений ниже среднего.

Следующее значение в наших данных, 12, имело z-показатель (12-14,375)/5,162 = -0,46 . Это означает, что значение «12» на 0,46 стандартного отклонения ниже среднего.

Чем дальше значение находится от среднего значения, тем выше будет абсолютное значение z-показателя для этого значения.

Например, значение 7 находится дальше от среднего значения (14,375), чем значение 12, что объясняет, почему 7 имел z-показатель с большим абсолютным значением.

Дополнительные ресурсы

В следующих статьях объясняется, как выполнять другие распространенные задачи в SAS:

Как выявить выбросы в SAS
Как рассчитать процентили в SAS
Как рассчитать среднее, медиану и моду в SAS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *