Як створити частотну таблицю кількох змінних у r


Щоб обчислити частотну таблицю для кількох змінних у кадрі даних у R, ви можете використати функцію apply() , яка використовує такий синтаксис:

застосувати (X, FUN MARGIN)

золото:

  • X: масив, матриця або блок даних
  • MARGIN: застосувати функцію до рядків (1) або стовпців (2)
  • FUN: функція для застосування

Наступні приклади показують, як використовувати цей синтаксис на практиці.

Приклад 1: Таблиця частот для всіх змінних у R

Наступний код показує, як обчислити таблицю частот для кожної змінної у кадрі даних:

 #create data frame
df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#view first few rows of data frame
head(df)

  var1 var2 var3
1 1 To 6
2 1 A 7
3 2 To 7
4 2 To 7
5 2 B 8
6 2 B 8

#calculate frequency table for every variable in data frame
apply((df), 2, table)

$var1

1 2 3 
2 4 1 

$var2

AB
4 3 

$var3

6 7 8 9 
1 3 2 1

Результатом є три частотні таблиці – по одній для кожної змінної у кадрі даних.

Ось як інтерпретувати першу частотну таблицю:

  • Значення 1 з’являється двічі в стовпці «var1».
  • Значення 2 з’являється 4 рази в стовпці «var2».
  • Значення 3 з’являється 1 раз у стовпці «var3».

Інші частотні таблиці можна інтерпретувати таким же чином.

Приклад 2: Таблиця частот для певних змінних у R

Наступний код показує, як обчислити таблицю частот для певних змінних у кадрі даних

 #create data frame
df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#calculate frequency table for var1 and var3 columns
apply((df[c(' var1 ', ' var3 ')]), 2, table)

$var1

1 2 3 
2 4 1

$var3

6 7 8 9 
1 3 2 1

Приклад 3: таблиця частот для всіх змінних, крім однієї, у R

Припустімо, що у кадрі даних є стовпець індексу, і ми хочемо обчислити таблицю частот для кожної змінної у кадрі даних , крім стовпця індексу.

Наступний код показує, як це зробити:

 #create data frame
df <- data. frame (index=c(1, 2, 3, 4, 5, 6, 7),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#calculate frequency table for all columns except index column
apply((df[-1]), 2, table)

$var2

AB
4 3 

$var3

6 7 8 9 
1 3 2 1

Додаткові ресурси

Як створити двосторонню таблицю в R
Як створити гістограму відносної частоти в R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *