Como calcular pontuações z no sas
Nas estatísticas, uma pontuação z nos diz quantos desvios padrão um valor está da média .
Usamos a seguinte fórmula para calcular uma pontuação z:
z = (X – μ) / σ
Ouro:
- X é um único valor de dados brutos
- μ é a média do conjunto de dados
- σ é o desvio padrão do conjunto de dados
O exemplo a seguir mostra como calcular pontuações z para valores de dados brutos no SAS.
Exemplo: calcular pontuações Z no SAS
Suponha que criemos o seguinte conjunto de dados no SAS:
/*create dataset*/ data original_data; input values; datalines ; 7 12 14 12 16 18 6 7 14 17 19 22 24 13 17 12 ; run ; /*view dataset*/ proc print data = original_data;
Agora, suponha que queiramos calcular a pontuação z para cada valor no conjunto de dados.
Podemos usar proc sql para fazer isso:
/*create new variable that shows z-scores for each raw data value*/
proc sql ;
select values, (values - mean(values)) / std(values) as z_scores
from original_data;
quit ;
A coluna de valores exibe os valores de dados originais e a coluna z_scores exibe a pontuação z para cada valor.
Como interpretar pontuações Z no SAS
Uma pontuação z nos diz quantos desvios padrão um valor está da média.
Uma pontuação z pode ser positiva, negativa ou zero.
Uma pontuação z positiva indica que um determinado valor está acima da média, uma pontuação z negativa indica que um determinado valor está abaixo da média e uma pontuação z zero indica que um determinado valor é igual à média.
Se calculássemos a média e o desvio padrão do nosso conjunto de dados, descobriríamos que a média é 14,375 e o desvio padrão é 5,162 .
Portanto, o primeiro valor em nosso conjunto de dados foi 7, que teve uma pontuação z de (7-14,375) / 5,162 = -1,428 . Isso significa que o valor “7” é 1,428 desvios padrão inferior à média.
O próximo valor em nossos dados, 12, teve uma pontuação z de (12-14,375) / 5,162 = -0,46 . Isso significa que o valor “12” é 0,46 desvios padrão inferior à média.
Quanto mais distante um valor estiver da média, maior será o valor absoluto do escore z para esse valor.
Por exemplo, o valor 7 está mais distante da média (14,375) do que o valor 12, o que explica porque 7 teve um escore z com valor absoluto maior.
Recursos adicionais
Os artigos a seguir explicam como executar outras tarefas comuns no SAS:
Como identificar outliers no SAS
Como calcular percentis no SAS
Como calcular média, mediana e moda no SAS