Sas: como usar proc univariate para testes de normalidade


Você pode usar proc univariate no SAS com a instrução normal para realizar vários testes de normalidade em uma variável em um conjunto de dados.

Este procedimento usa a seguinte sintaxe básica:

 proc univariate data =my_data normal ;
    var my_variable;
run ;

O exemplo a seguir mostra como usar esse procedimento na prática.

Exemplo: Proc Univariate para teste de normalidade no SAS

Suponha que temos o seguinte conjunto de dados no SAS que contém informações sobre vários jogadores de basquete:

 /*create dataset*/
data my_data;
    input team $pointsrebounds;
    datalines ;
At 12 8
At 12 8
At 12 8
At 23 9
At 20 12
At 14 7
At 14 7
B 20 2
B 20 5
B 29 4
B 14 7
B 20 2
B 20 2
B 20 5
;
run ;

/*view dataset*/
proc print data =my_data;

Podemos usar proc univariate com a instrução normal para realizar vários testes de normalidade na variável points :

 proc univariate data =my_data normal ;
    var points;
run ;

Várias tabelas serão exibidas no resultado, mas aquela intitulada Testes de Normalidade contém os resultados dos testes de normalidade:

Teste de normalidade univariada SAS proc

Por padrão, o SAS realiza quatro testes de normalidade e exibe cada uma de suas estatísticas de teste e valores p correspondentes:

  • Teste de Shapiro-Wilk : W = 0,867, p = 0,0383
  • Teste de Kolmogorov-Smirnov : D = 0,237, p = 0,0318
  • Teste de Cramer-von Mises : W-Sq = 0,152, p = 0,0200
  • Teste Anderson-Darling : A-Sq = 0,847, p = 0,0223

Cada teste de normalidade utiliza as seguintes hipóteses nulas e alternativas:

  • H 0 : Os dados são normalmente distribuídos.
  • HA : Os dados não são normalmente distribuídos.

Como o valor p para cada teste de normalidade é inferior a 0,05, rejeitaríamos a hipótese nula para cada teste de normalidade.

Isto significa que há evidências suficientes para concluir que a variável pontos não tem distribuição normal.

Observe que você também pode criar um histograma com uma curva normal sobreposta para visualizar a distribuição dos valores da variável pontos :

 proc univariate data =my_data;
    histogram points / normal ;
run ; 

O histograma mostra-nos que a distribuição dos valores não segue muito bem a curva normal, o que está de acordo com os resultados dos testes de normalidade que realizámos.

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como usar o resumo do procedimento no SAS
Como usar o Proc Tabulate no SAS
Como usar o agrupamento Proc no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *