Como usar proc tabulate no sas (com exemplos)


Você pode usar proc tabulate no SAS para exibir rapidamente estatísticas descritivas para uma ou mais variáveis em formato tabular.

Os exemplos a seguir mostram como usar esse procedimento com o seguinte conjunto de dados que mostra o total de pontos marcados por 12 jogadores de basquete diferentes:

 /*create dataset*/
data my_data;
    input team $position $points;
    datalines ;
A Guard 15
A Guard 12
A Guard 29
A Forward 13
A Forward 9
A Forward 16
B Guard 25
B Guard 20
C Guard 34
C Forward 19
C Forward 3
C Forward 8
;
run ;

/*view dataset*/
proc print data =my_data;

Exemplo 1: Proc Tabulate com uma variável

Podemos usar o seguinte código para calcular estatísticas descritivas para a variável pontos:

 /*create table that displays descriptive stats for points variable */
proc tabulate data =my_data;
    var points;
    table points * (N Min Q1 Median Mean Q3 Max);
run ; 

Nota : Os valores entre parênteses informam ao SAS quais estatísticas descritivas calcular para os pontos.

Aqui estão algumas das estatísticas descritivas mais comumente usadas:

  • N : O número total de observações
  • Mín : O valor mínimo
  • Q1 : O valor do primeiro quantil (ou seja, o 25º percentil)
  • Mediana : o valor mediano
  • Média : O valor médio
  • Q3 : O valor do terceiro quantil (ou seja, o 75º percentil)
  • Máx .: O valor máximo

Pelo resultado podemos ver:

  • O número total de observações é 12 .
  • O valor mínimo de pontos é 3 .
  • O número de pontos no percentil 25 é 10,5 .
  • O número médio de pontos é 15,5 .
  • O número médio de pontos é 16,92 .
  • O número de pontos no percentil 75 é 22,5 .
  • O número máximo de pontos é 34 .

A partir desses cinco valores, podemos obter uma compreensão bastante boa da distribuição de valores da variável Peso.

Exemplo 2: Proc Tabulate com duas variáveis

Podemos usar o código a seguir para calcular estatísticas descritivas para a variável pontos, agrupada pela variável equipe:

 /*create table that displays descriptive stats for points, grouped by team */
proc tabulate data =my_data;
    classteam ;
    var points;
    table team, points * (N Min Q1 Median Mean Q3 Max);
run ; 

A tabela resultante mostra as estatísticas descritivas de pontos para cada uma das três equipes.

Por exemplo:

  • A equipe A tem 6 observações.
  • O valor mínimo de pontos para a Equipe A é 9 .
  • O número de pontos da equipe A no 25º percentil é 12 .
  • O número médio de pontos da equipe A é 14 .

E assim por diante.

Exemplo 3: Proc Tabulate com três variáveis

Podemos usar o código a seguir para calcular estatísticas descritivas para a variável pontos, agrupadas por variáveis de equipe e posição:

 /*create table that shows descriptive stats for points, grouped by team and position */
proc tabulate data =my_data;
class team position;
    var points;
    table team, position *points* (N Min Q1 Median Mean Q3 Max);
run ; 

A tabela resultante mostra as estatísticas descritivas dos pontos, agrupados por equipe e posição.

Observe que as células do Time “B” e da posição “Atacante” estão vazias porque nenhum jogador do Time B tinha uma posição de Atacante.

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como usar o resumo do procedimento no SAS
Como calcular a correlação no SAS
Como criar tabelas de frequência no SAS
Como criar boxplots por grupo no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *