Como usar proc tabulate no sas (com exemplos)
Você pode usar proc tabulate no SAS para exibir rapidamente estatísticas descritivas para uma ou mais variáveis em formato tabular.
Os exemplos a seguir mostram como usar esse procedimento com o seguinte conjunto de dados que mostra o total de pontos marcados por 12 jogadores de basquete diferentes:
/*create dataset*/
data my_data;
input team $position $points;
datalines ;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run ;
/*view dataset*/
proc print data =my_data;
Exemplo 1: Proc Tabulate com uma variável
Podemos usar o seguinte código para calcular estatísticas descritivas para a variável pontos:
/*create table that displays descriptive stats for points variable */
proc tabulate data =my_data;
var points;
table points * (N Min Q1 Median Mean Q3 Max);
run ;
Nota : Os valores entre parênteses informam ao SAS quais estatísticas descritivas calcular para os pontos.
Aqui estão algumas das estatísticas descritivas mais comumente usadas:
- N : O número total de observações
- Mín : O valor mínimo
- Q1 : O valor do primeiro quantil (ou seja, o 25º percentil)
- Mediana : o valor mediano
- Média : O valor médio
- Q3 : O valor do terceiro quantil (ou seja, o 75º percentil)
- Máx .: O valor máximo
Pelo resultado podemos ver:
- O número total de observações é 12 .
- O valor mínimo de pontos é 3 .
- O número de pontos no percentil 25 é 10,5 .
- O número médio de pontos é 15,5 .
- O número médio de pontos é 16,92 .
- O número de pontos no percentil 75 é 22,5 .
- O número máximo de pontos é 34 .
A partir desses cinco valores, podemos obter uma compreensão bastante boa da distribuição de valores da variável Peso.
Exemplo 2: Proc Tabulate com duas variáveis
Podemos usar o código a seguir para calcular estatísticas descritivas para a variável pontos, agrupada pela variável equipe:
/*create table that displays descriptive stats for points, grouped by team */
proc tabulate data =my_data;
classteam ;
var points;
table team, points * (N Min Q1 Median Mean Q3 Max);
run ;
A tabela resultante mostra as estatísticas descritivas de pontos para cada uma das três equipes.
Por exemplo:
- A equipe A tem 6 observações.
- O valor mínimo de pontos para a Equipe A é 9 .
- O número de pontos da equipe A no 25º percentil é 12 .
- O número médio de pontos da equipe A é 14 .
E assim por diante.
Exemplo 3: Proc Tabulate com três variáveis
Podemos usar o código a seguir para calcular estatísticas descritivas para a variável pontos, agrupadas por variáveis de equipe e posição:
/*create table that shows descriptive stats for points, grouped by team and position */
proc tabulate data =my_data;
class team position;
var points;
table team, position *points* (N Min Q1 Median Mean Q3 Max);
run ;
A tabela resultante mostra as estatísticas descritivas dos pontos, agrupados por equipe e posição.
Observe que as células do Time “B” e da posição “Atacante” estão vazias porque nenhum jogador do Time B tinha uma posição de Atacante.
Recursos adicionais
Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:
Como usar o resumo do procedimento no SAS
Como calcular a correlação no SAS
Como criar tabelas de frequência no SAS
Como criar boxplots por grupo no SAS