Como calcular assimetria e curtose no sas


Nas estatísticas, a assimetria e a curtose são duas maneiras de medir a forma de uma distribuição.

A assimetria mede a assimetria de uma distribuição.

  • A assimetria negativa indica que a cauda está no lado esquerdo da distribuição.
  • Uma inclinação positiva indica que a cauda está no lado direito da distribuição.
  • Um valor zero indica que não há assimetria na distribuição, o que significa que a distribuição é perfeitamente simétrica.

A curtose mede se uma distribuição tem cauda pesada ou leve em comparação com uma distribuição normal .

  • A curtose de uma distribuição normal é 0.
  • Se uma determinada distribuição tiver uma curtose menor que 0, ela é considerada playkurtica , o que significa que tende a produzir menos valores discrepantes e menos extremos do que a distribuição normal.
  • Se uma determinada distribuição tiver curtose superior a 0, diz-se que é leptocúrtica , o que significa que tende a produzir mais valores discrepantes do que a distribuição normal.

Para calcular assimetria e curtose de variáveis no SAS, você pode usar as instruções SKEWNESS e KURTOSIS em PROC MEANS .

O exemplo a seguir mostra como usar essas instruções na prática.

Exemplo: Calculando assimetria e curtose no SAS

Suponha que temos o seguinte conjunto de dados no SAS que contém informações sobre vários jogadores de basquete:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
At 10 2
At 17 5
At 17 6
At 18 3
At 15 0
B 10 2
B 14 5
B 13 4
B 29 0
B 25 2
C 12 1
C 30 1
C 34 3
C 12 4
C 11 7
;
run ;

/*view dataset*/
proc print data =my_data; 

Podemos usar PROC MEANS com as instruções SKEWNESS e KURTOSIS para calcular a assimetria e a curtose de cada variável numérica no conjunto de dados:

 /*calculate skewness and kurtosis for each numeric variable*/
proc means data =my_data SKEWNESS KURTOSIS ;
run ; 

A tabela de saída exibe os valores de assimetria e curtose para cada variável numérica no conjunto de dados:

(1) pontos

  • A variável points tem uma assimetria de 1,009 . Como esse valor é maior que 0, significa que a cauda está do lado direito da distribuição.
  • A variável points tem uma curtose de -0,299 . Como esse valor é menor que 0, significa que a distribuição tem um pouco menos valores discrepantes e menos valores extremos do que a distribuição normal.

(2) ajuda

  • A variável assistências tem uma assimetria de 0,304 . Como esse valor é maior que 0, significa que a cauda está do lado direito da distribuição.
  • A variável suporte apresenta curtose de -0,782 . Como esse valor é menor que 0, significa que a distribuição tem menos valores discrepantes e menos valores extremos do que a distribuição normal.

Para visualizar a distribuição de valores para cada variável numérica no conjunto de dados, você pode usar PROC UNIVARIATE para criar histogramas para as variáveis de ponto e assistência:

 /*create histograms for points and assists variables*/
proc univariate data =my_data;
    var points assists;
    histogram points assists;
run ;

Isso produz o seguinte histograma para a variável points :

E o seguinte histograma para a variável assistencial :

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como calcular estatísticas descritivas no SAS
Como criar tabelas de frequência no SAS
Como calcular percentis no SAS
Como criar tabelas dinâmicas no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *