Como calcular estatísticas descritivas no sas


Estatísticas descritivas são valores que descrevem um conjunto de dados.

Eles nos ajudam a entender onde está o centro do conjunto de dados, bem como a distribuição dos valores no conjunto de dados.

Existem duas maneiras comuns de calcular estatísticas descritivas para variáveis no SAS:

1. Use PROC MEANS para calcular estatísticas resumidas

2. Use PROC UNIVARIATE para calcular estatísticas descritivas detalhadas

Os exemplos a seguir mostram como usar cada método na prática com o seguinte conjunto de dados no SAS:

 /*create dataset*/
data my_data;
    input team $points assists;
    datalines ;
At 10 2
At 17 5
At 17 6
At 18 3
At 15 0
B 10 2
B 14 5
B 13 4
B 29 0
B 25 2
C 12 1
C 30 1
C 34 3
C 12 4
C 11 7
;
run ;

/*view dataset*/
proc print data =my_data; 

Exemplo 1. Use PROC MEANS para calcular estatísticas resumidas

O código a seguir mostra como usar PROC MEANS para calcular estatísticas resumidas para a variável de pontos no conjunto de dados:

 /*calculate summary statistics for points variable*/
proc means data =my_data;
    var points;
run ; 

estatística descritiva em SAS usando PROC MEANS

O procedimento PROC MEANS calcula as seguintes estatísticas descritivas:

  • N : O número total de observações
  • Média : O valor médio dos pontos
  • Std Dev: o desvio padrão dos pontos
  • Mínimo : O valor mínimo de pontos
  • Máximo : O valor máximo de pontos

Observe também que você pode usar a instrução class para calcular estatísticas descritivas para uma variável, agrupada por outra variável.

Por exemplo, podemos usar o código a seguir para calcular estatísticas resumidas para a variável pontos , agrupada pela variável equipe :

 /*calculate summary statistics for points, grouped by team*/
proc means data =my_data;
    classteam ;
    var points;
run ; 

A saída exibe estatísticas resumidas para a variável de pontos , agrupadas por cada um dos valores exclusivos da equipe .

Exemplo 2. Use PROC UNIVARIATE para calcular estatísticas descritivas detalhadas

O código a seguir mostra como usar PROC UNIVARIATE para calcular estatísticas descritivas detalhadas para a variável points :

 /*calculate detailed descriptive statistics for points variable*/
proc univariate data =my_data;
    var points;
run ; 

O procedimento PROC UNIVARIATE calcula estatísticas descritivas detalhadas para a variável pontual , incluindo média, mediana, moda, desvio padrão, variância, intervalo, intervalo interquartil, etc.

Também podemos usar a instrução class para calcular essas estatísticas descritivas detalhadas para a variável points , agrupada pela variável team :

 /*calculate detailed descriptive statistics for points, grouped by team*/
proc univariate data =my_data;
    classteam ;
    var points;
run ;

Isso produzirá três grupos de tabelas de saída que exibem estatísticas descritivas detalhadas para a variável de pontos , agrupadas por cada um dos valores exclusivos da equipe .

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como criar tabelas de frequência no SAS
Como calcular percentis no SAS
Como criar tabelas dinâmicas no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *