Como calcular estatísticas descritivas no sas
Estatísticas descritivas são valores que descrevem um conjunto de dados.
Eles nos ajudam a entender onde está o centro do conjunto de dados, bem como a distribuição dos valores no conjunto de dados.
Existem duas maneiras comuns de calcular estatísticas descritivas para variáveis no SAS:
1. Use PROC MEANS para calcular estatísticas resumidas
2. Use PROC UNIVARIATE para calcular estatísticas descritivas detalhadas
Os exemplos a seguir mostram como usar cada método na prática com o seguinte conjunto de dados no SAS:
/*create dataset*/ data my_data; input team $points assists; datalines ; At 10 2 At 17 5 At 17 6 At 18 3 At 15 0 B 10 2 B 14 5 B 13 4 B 29 0 B 25 2 C 12 1 C 30 1 C 34 3 C 12 4 C 11 7 ; run ; /*view dataset*/ proc print data =my_data;
Exemplo 1. Use PROC MEANS para calcular estatísticas resumidas
O código a seguir mostra como usar PROC MEANS para calcular estatísticas resumidas para a variável de pontos no conjunto de dados:
/*calculate summary statistics for points variable*/ proc means data =my_data; var points; run ;
O procedimento PROC MEANS calcula as seguintes estatísticas descritivas:
- N : O número total de observações
- Média : O valor médio dos pontos
- Std Dev: o desvio padrão dos pontos
- Mínimo : O valor mínimo de pontos
- Máximo : O valor máximo de pontos
Observe também que você pode usar a instrução class para calcular estatísticas descritivas para uma variável, agrupada por outra variável.
Por exemplo, podemos usar o código a seguir para calcular estatísticas resumidas para a variável pontos , agrupada pela variável equipe :
/*calculate summary statistics for points, grouped by team*/ proc means data =my_data; classteam ; var points; run ;
A saída exibe estatísticas resumidas para a variável de pontos , agrupadas por cada um dos valores exclusivos da equipe .
Exemplo 2. Use PROC UNIVARIATE para calcular estatísticas descritivas detalhadas
O código a seguir mostra como usar PROC UNIVARIATE para calcular estatísticas descritivas detalhadas para a variável points :
/*calculate detailed descriptive statistics for points variable*/ proc univariate data =my_data; var points; run ;
O procedimento PROC UNIVARIATE calcula estatísticas descritivas detalhadas para a variável pontual , incluindo média, mediana, moda, desvio padrão, variância, intervalo, intervalo interquartil, etc.
Também podemos usar a instrução class para calcular essas estatísticas descritivas detalhadas para a variável points , agrupada pela variável team :
/*calculate detailed descriptive statistics for points, grouped by team*/ proc univariate data =my_data; classteam ; var points; run ;
Isso produzirá três grupos de tabelas de saída que exibem estatísticas descritivas detalhadas para a variável de pontos , agrupadas por cada um dos valores exclusivos da equipe .
Recursos adicionais
Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:
Como criar tabelas de frequência no SAS
Como calcular percentis no SAS
Como criar tabelas dinâmicas no SAS