Como criar tabelas de frequência relativa em r


Uma tabela de frequência relativa informa com que frequência determinados valores em um conjunto de dados aparecem em relação ao número total de valores no conjunto de dados.

Você pode usar a seguinte sintaxe básica para criar uma tabela de frequência em R:

 table(data)/length(data)

A função table() calcula a frequência de cada valor de dados individual e a função length() calcula o número total de valores no conjunto de dados.

Assim, dividindo cada frequência individual pelo comprimento do conjunto de dados, obtemos a frequência relativa de cada valor no conjunto de dados.

Os exemplos a seguir mostram como usar essa sintaxe na prática.

Exemplo 1: Tabela de frequência relativa para um vetor

O código a seguir mostra como criar uma tabela de frequência relativa para um único vetor em R:

 #define data
data <- c('A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C')

#create relative frequency table
table(data)/length(data)

  ABC
0.2 0.3 0.5

Veja como interpretar a tabela:

  • 20% de todos os valores no conjunto de dados são a letra A
  • 30% de todos os valores no conjunto de dados são a letra B
  • 50% de todos os valores no conjunto de dados são a letra C

Exemplo 2: Tabela de frequência relativa para uma coluna de quadro de dados

O código a seguir mostra como criar uma tabela de frequência relativa para uma coluna de um quadro de dados em R:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'),
                 wins=c(2, 9, 11, 12, 15, 17, 18, 19),
                 dots=c(1, 2, 2, 2, 3, 3, 3, 3))

#view first few rows of data frame
head(df)

  team wins points
1 to 2 1
2 to 9 2
3 to 11 2
4 to 12 2
5 to 15 3
6 B 17 3

#calculate relative frequency table for 'team' column
table(df$team)/length(df$team)
 
    ABC
0.625 0.250 0.125

Exemplo 3: Tabela de frequência relativa para todas as colunas do quadro de dados

O código a seguir mostra como criar uma tabela de frequência relativa para cada coluna de um quadro de dados em R:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'),
                 wins=c(2, 9, 11, 12, 15, 17, 18, 19),
                 dots=c(1, 2, 2, 2, 3, 3, 3, 3))

#calculate relative frequency table for each column
sapply(df, function (x) table(x)/nrow(df))

$team
x
    ABC
0.625 0.250 0.125 

$wins
x
    2 9 11 12 15 17 18 19 
0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125 

$points
x
    1 2 3 
0.125 0.375 0.500 

Recursos adicionais

Como criar tabelas de frequência em R
Como criar uma tabela de frequência de múltiplas variáveis em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *