Як створити таблиці відносної частоти в r


Таблиця відносної частоти повідомляє вам, як часто з’являються певні значення в наборі даних відносно загальної кількості значень у наборі даних.

Ви можете використовувати наступний базовий синтаксис для створення таблиці частот у R:

 table(data)/length(data)

Функція table() обчислює частоту кожного окремого значення даних, а функція length() обчислює загальну кількість значень у наборі даних.

Отже, поділивши кожну окрему частоту на довжину набору даних, ми отримаємо відносну частоту кожного значення в наборі даних.

Наступні приклади показують, як використовувати цей синтаксис на практиці.

Приклад 1: Таблиця відносної частоти для вектора

Наступний код показує, як створити таблицю відносної частоти для одного вектора в R:

 #define data
data <- c('A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C')

#create relative frequency table
table(data)/length(data)

  ABC
0.2 0.3 0.5

Ось як інтерпретувати таблицю:

  • 20% всіх значень в наборі даних – це буква А
  • 30% всіх значень в наборі даних – це буква B
  • 50% всіх значень в наборі даних – це буква С

Приклад 2: таблиця відносної частоти для стовпця кадру даних

Наступний код показує, як створити таблицю відносної частоти для стовпця кадру даних у R:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'),
                 wins=c(2, 9, 11, 12, 15, 17, 18, 19),
                 dots=c(1, 2, 2, 2, 3, 3, 3, 3))

#view first few rows of data frame
head(df)

  team wins points
1 to 2 1
2 to 9 2
3 to 11 2
4 to 12 2
5 to 15 3
6 B 17 3

#calculate relative frequency table for 'team' column
table(df$team)/length(df$team)
 
    ABC
0.625 0.250 0.125

Приклад 3: таблиця відносної частоти для всіх стовпців у кадрі даних

Наступний код показує, як створити таблицю відносної частоти для кожного стовпця кадру даних у R:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'),
                 wins=c(2, 9, 11, 12, 15, 17, 18, 19),
                 dots=c(1, 2, 2, 2, 3, 3, 3, 3))

#calculate relative frequency table for each column
sapply(df, function (x) table(x)/nrow(df))

$team
x
    ABC
0.625 0.250 0.125 

$wins
x
    2 9 11 12 15 17 18 19 
0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125 

$points
x
    1 2 3 
0.125 0.375 0.500 

Додаткові ресурси

Як створити частотні таблиці в R
Як створити частотну таблицю кількох змінних у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *