Sas: como usar proc univariate para testes de normalidade
Você pode usar proc univariate no SAS com a instrução normal para realizar vários testes de normalidade em uma variável em um conjunto de dados.
Este procedimento usa a seguinte sintaxe básica:
proc univariate data =my_data normal ;
var my_variable;
run ;
O exemplo a seguir mostra como usar esse procedimento na prática.
Exemplo: Proc Univariate para teste de normalidade no SAS
Suponha que temos o seguinte conjunto de dados no SAS que contém informações sobre vários jogadores de basquete:
/*create dataset*/
data my_data;
input team $pointsrebounds;
datalines ;
At 12 8
At 12 8
At 12 8
At 23 9
At 20 12
At 14 7
At 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run ;
/*view dataset*/
proc print data =my_data;
Podemos usar proc univariate com a instrução normal para realizar vários testes de normalidade na variável points :
proc univariate data =my_data normal ;
var points;
run ;
Várias tabelas serão exibidas no resultado, mas aquela intitulada Testes de Normalidade contém os resultados dos testes de normalidade:
Por padrão, o SAS realiza quatro testes de normalidade e exibe cada uma de suas estatísticas de teste e valores p correspondentes:
- Teste de Shapiro-Wilk : W = 0,867, p = 0,0383
- Teste de Kolmogorov-Smirnov : D = 0,237, p = 0,0318
- Teste de Cramer-von Mises : W-Sq = 0,152, p = 0,0200
- Teste Anderson-Darling : A-Sq = 0,847, p = 0,0223
Cada teste de normalidade utiliza as seguintes hipóteses nulas e alternativas:
- H 0 : Os dados são normalmente distribuídos.
- HA : Os dados não são normalmente distribuídos.
Como o valor p para cada teste de normalidade é inferior a 0,05, rejeitaríamos a hipótese nula para cada teste de normalidade.
Isto significa que há evidências suficientes para concluir que a variável pontos não tem distribuição normal.
Observe que você também pode criar um histograma com uma curva normal sobreposta para visualizar a distribuição dos valores da variável pontos :
proc univariate data =my_data;
histogram points / normal ;
run ;
O histograma mostra-nos que a distribuição dos valores não segue muito bem a curva normal, o que está de acordo com os resultados dos testes de normalidade que realizámos.
Recursos adicionais
Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:
Como usar o resumo do procedimento no SAS
Como usar o Proc Tabulate no SAS
Como usar o agrupamento Proc no SAS