Como criar tabelas de frequência relativa em r
Uma tabela de frequência relativa informa com que frequência determinados valores em um conjunto de dados aparecem em relação ao número total de valores no conjunto de dados.
Você pode usar a seguinte sintaxe básica para criar uma tabela de frequência em R:
table(data)/length(data)
A função table() calcula a frequência de cada valor de dados individual e a função length() calcula o número total de valores no conjunto de dados.
Assim, dividindo cada frequência individual pelo comprimento do conjunto de dados, obtemos a frequência relativa de cada valor no conjunto de dados.
Os exemplos a seguir mostram como usar essa sintaxe na prática.
Exemplo 1: Tabela de frequência relativa para um vetor
O código a seguir mostra como criar uma tabela de frequência relativa para um único vetor em R:
#define data data <- c('A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C') #create relative frequency table table(data)/length(data) ABC 0.2 0.3 0.5
Veja como interpretar a tabela:
- 20% de todos os valores no conjunto de dados são a letra A
- 30% de todos os valores no conjunto de dados são a letra B
- 50% de todos os valores no conjunto de dados são a letra C
Exemplo 2: Tabela de frequência relativa para uma coluna de quadro de dados
O código a seguir mostra como criar uma tabela de frequência relativa para uma coluna de um quadro de dados em R:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'), wins=c(2, 9, 11, 12, 15, 17, 18, 19), dots=c(1, 2, 2, 2, 3, 3, 3, 3)) #view first few rows of data frame head(df) team wins points 1 to 2 1 2 to 9 2 3 to 11 2 4 to 12 2 5 to 15 3 6 B 17 3 #calculate relative frequency table for 'team' column table(df$team)/length(df$team) ABC 0.625 0.250 0.125
Exemplo 3: Tabela de frequência relativa para todas as colunas do quadro de dados
O código a seguir mostra como criar uma tabela de frequência relativa para cada coluna de um quadro de dados em R:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'), wins=c(2, 9, 11, 12, 15, 17, 18, 19), dots=c(1, 2, 2, 2, 3, 3, 3, 3)) #calculate relative frequency table for each column sapply(df, function (x) table(x)/nrow(df)) $team x ABC 0.625 0.250 0.125 $wins x 2 9 11 12 15 17 18 19 0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125 $points x 1 2 3 0.125 0.375 0.500
Recursos adicionais
Como criar tabelas de frequência em R
Como criar uma tabela de frequência de múltiplas variáveis em R