Як створити таблицю непередбачуваності в r


Таблиця непередбачених обставин (іноді її називають «перехресними таблицями») — це тип таблиці, яка підсумовує зв’язок між двома категоріальними змінними.

На щастя, легко створити таблицю непередбачених обставин для змінних у R за допомогою функції зведеної таблиці. Цей посібник показує приклад того, як це зробити.

Приклад: таблиця непередбачуваності в R

Припустімо, у нас є такий набір даних, який відображає інформацію про 20 різних замовлень продуктів, включаючи тип придбаного продукту, а також країну, у якій продукт було придбано:

 #create data
df <- data.frame(order_num = 1:20,
                 product= rep (c(' TV ', ' Radio ', ' Computer '), times =c(9, 6, 5)),
                 country= rep (c(' A ', ' B ', ' C ', ' D '), times =5))

#view data
df

   order_num product country
1 1 TV A
2 2 TV B
3 3 TV C
4 4 TV D
5 5 TV A
6 6 TV B
7 7 TV C
8 8 TV D
9 9 TV A
10 10 Radio B
11 11 Radio C
12 12 Radio D
13 13 Radio A
14 14 Radio B
15 15 Radio C
16 16 Computer D
17 17 Computer A
18 18 Computer B
19 19 Computer C
20 20 Computer D

Щоб створити таблицю непередбачених обставин, ми можемо просто використати функцію table() і надати змінні продукту та країни як аргументи:

 #create contingency table
table <- table(df$product, df$country)

#view contingency table
table

           ABCD
  Computer 1 1 1 2
  Radio 1 2 2 1
  TV 3 2 2 2

Ми також можемо використовувати функцію addmargins() , щоб додати поля до таблиці:

 #add margins to contingency table
table_w_margins <- addmargins(table)

#view contingency table
table_w_margins

            ABCD Sum
  Computer 1 1 1 2 5
  Radio 1 2 2 1 6
  TV 3 2 2 2 9
  Sum 5 5 5 5 20

Ось як інтерпретувати таблицю:

  • Значення в нижньому правому куті вказує на загальну кількість замовлених товарів: 20.
  • Значення в правій частині показують суми рядків: загалом було замовлено 5 комп’ютерів, 6 радіо та 9 телевізорів.
  • Значення в нижній частині таблиці показують суми стовпців: загалом 5 продуктів було замовлено в країні A, 5 у країні B, 5 у країні C і 5 у країні D.
  • Значення всередині таблиці вказують на кількість конкретних продуктів, замовлених у кожній країні: 1 комп’ютер з країни А, 1 радіо з країни А, 3 телевізори з країни А тощо.

Додаткові ресурси

Як усереднити стовпці в R
Як підсумувати певні стовпці в R
Як обчислити середнє значення кількох стовпців у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *