Как создать таблицы относительных частот в r
Таблица относительной частоты показывает, как часто появляются определенные значения в наборе данных по отношению к общему количеству значений в наборе данных.
Вы можете использовать следующий базовый синтаксис для создания таблицы частот в R:
table(data)/length(data)
Функция table() вычисляет частоту каждого отдельного значения данных, а функция length() вычисляет общее количество значений в наборе данных.
Итак, разделив каждую отдельную частоту на длину набора данных, мы получаем относительную частоту каждого значения в наборе данных.
Следующие примеры показывают, как использовать этот синтаксис на практике.
Пример 1: Таблица относительных частот для вектора
Следующий код показывает, как создать таблицу относительных частот для одного вектора в R:
#define data data <- c('A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C') #create relative frequency table table(data)/length(data) ABC 0.2 0.3 0.5
Вот как интерпретировать таблицу:
- 20% всех значений в наборе данных — это буква А
- 30% всех значений в наборе данных — это буква B
- 50% всех значений в наборе данных — это буква C
Пример 2: Таблица относительной частоты для столбца кадра данных
Следующий код показывает, как создать таблицу относительной частоты для столбца кадра данных в R:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'), wins=c(2, 9, 11, 12, 15, 17, 18, 19), dots=c(1, 2, 2, 2, 3, 3, 3, 3)) #view first few rows of data frame head(df) team wins points 1 to 2 1 2 to 9 2 3 to 11 2 4 to 12 2 5 to 15 3 6 B 17 3 #calculate relative frequency table for 'team' column table(df$team)/length(df$team) ABC 0.625 0.250 0.125
Пример 3. Таблица относительной частоты для всех столбцов во фрейме данных.
Следующий код показывает, как создать таблицу относительных частот для каждого столбца кадра данных в R:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'), wins=c(2, 9, 11, 12, 15, 17, 18, 19), dots=c(1, 2, 2, 2, 3, 3, 3, 3)) #calculate relative frequency table for each column sapply(df, function (x) table(x)/nrow(df)) $team x ABC 0.625 0.250 0.125 $wins x 2 9 11 12 15 17 18 19 0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125 $points x 1 2 3 0.125 0.375 0.500
Дополнительные ресурсы
Как создать таблицы частот в R
Как создать таблицу частот нескольких переменных в R