Як створити частотну таблицю кількох змінних у r
Щоб обчислити частотну таблицю для кількох змінних у кадрі даних у R, ви можете використати функцію apply() , яка використовує такий синтаксис:
застосувати (X, FUN MARGIN)
золото:
- X: масив, матриця або блок даних
- MARGIN: застосувати функцію до рядків (1) або стовпців (2)
- FUN: функція для застосування
Наступні приклади показують, як використовувати цей синтаксис на практиці.
Приклад 1: Таблиця частот для всіх змінних у R
Наступний код показує, як обчислити таблицю частот для кожної змінної у кадрі даних:
#create data frame df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3), var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'), var3=c(6, 7, 7, 7, 8, 8, 9)) #view first few rows of data frame head(df) var1 var2 var3 1 1 To 6 2 1 A 7 3 2 To 7 4 2 To 7 5 2 B 8 6 2 B 8 #calculate frequency table for every variable in data frame apply((df), 2, table) $var1 1 2 3 2 4 1 $var2 AB 4 3 $var3 6 7 8 9 1 3 2 1
Результатом є три частотні таблиці – по одній для кожної змінної у кадрі даних.
Ось як інтерпретувати першу частотну таблицю:
- Значення 1 з’являється двічі в стовпці «var1».
- Значення 2 з’являється 4 рази в стовпці «var2».
- Значення 3 з’являється 1 раз у стовпці «var3».
Інші частотні таблиці можна інтерпретувати таким же чином.
Приклад 2: Таблиця частот для певних змінних у R
Наступний код показує, як обчислити таблицю частот для певних змінних у кадрі даних
#create data frame df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3), var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'), var3=c(6, 7, 7, 7, 8, 8, 9)) #calculate frequency table for var1 and var3 columns apply((df[c(' var1 ', ' var3 ')]), 2, table) $var1 1 2 3 2 4 1 $var3 6 7 8 9 1 3 2 1
Приклад 3: таблиця частот для всіх змінних, крім однієї, у R
Припустімо, що у кадрі даних є стовпець індексу, і ми хочемо обчислити таблицю частот для кожної змінної у кадрі даних , крім стовпця індексу.
Наступний код показує, як це зробити:
#create data frame df <- data. frame (index=c(1, 2, 3, 4, 5, 6, 7), var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'), var3=c(6, 7, 7, 7, 8, 8, 9)) #calculate frequency table for all columns except index column apply((df[-1]), 2, table) $var2 AB 4 3 $var3 6 7 8 9 1 3 2 1
Додаткові ресурси
Як створити двосторонню таблицю в R
Як створити гістограму відносної частоти в R