Как рассчитать баллы z в sas
В статистике z-показатель говорит нам, на сколько стандартных отклонений значение находится от среднего значения .
Для расчета z-показателя мы используем следующую формулу:
z = (X – µ)/σ
Золото:
- X — одно значение необработанных данных.
- μ — среднее значение набора данных
- σ — стандартное отклонение набора данных
В следующем примере показано, как рассчитать z-показатели для значений необработанных данных в SAS.
Пример: расчет Z-показателей в SAS
Предположим, мы создаем следующий набор данных в SAS:
/*create dataset*/ data original_data; input values; datalines ; 7 12 14 12 16 18 6 7 14 17 19 22 24 13 17 12 ; run ; /*view dataset*/ proc print data = original_data;
Теперь предположим, что мы хотим вычислить z-показатель для каждого значения в наборе данных.
Для этого мы можем использовать proc sql :
/*create new variable that shows z-scores for each raw data value*/
proc sql ;
select values, (values - mean(values)) / std(values) as z_scores
from original_data;
quit ;
В столбце значений отображаются исходные значения данных, а в столбце z_scores отображается z-оценка для каждого значения.
Как интерпретировать показатели Z в SAS
Z-показатель говорит нам, на сколько стандартных отклонений значение отличается от среднего.
Показатель z может быть положительным, отрицательным или нулевым.
Положительный показатель z указывает на то, что определенное значение выше среднего, отрицательный показатель z указывает на то, что определенное значение ниже среднего, а нулевой показатель az указывает на то, что конкретное значение равно среднему.
Если бы мы вычислили среднее и стандартное отклонение нашего набора данных, мы бы обнаружили, что среднее значение составляет 14,375 , а стандартное отклонение — 5,162 .
Итак, первое значение в нашем наборе данных было 7, которое имело z-показатель (7-14,375) / 5,162 = -1,428 . Это означает, что значение «7» на 1,428 стандартных отклонений ниже среднего.
Следующее значение в наших данных, 12, имело z-показатель (12-14,375)/5,162 = -0,46 . Это означает, что значение «12» на 0,46 стандартного отклонения ниже среднего.
Чем дальше значение находится от среднего значения, тем выше будет абсолютное значение z-показателя для этого значения.
Например, значение 7 находится дальше от среднего значения (14,375), чем значение 12, что объясняет, почему 7 имел z-показатель с большим абсолютным значением.
Дополнительные ресурсы
В следующих статьях объясняется, как выполнять другие распространенные задачи в SAS:
Как выявить выбросы в SAS
Как рассчитать процентили в SAS
Как рассчитать среднее, медиану и моду в SAS