Як створити таблицю непередбачуваності в r
Таблиця непередбачених обставин (іноді її називають «перехресними таблицями») — це тип таблиці, яка підсумовує зв’язок між двома категоріальними змінними.
На щастя, легко створити таблицю непередбачених обставин для змінних у R за допомогою функції зведеної таблиці. Цей посібник показує приклад того, як це зробити.
Приклад: таблиця непередбачуваності в R
Припустімо, у нас є такий набір даних, який відображає інформацію про 20 різних замовлень продуктів, включаючи тип придбаного продукту, а також країну, у якій продукт було придбано:
#create data df <- data.frame(order_num = 1:20, product= rep (c(' TV ', ' Radio ', ' Computer '), times =c(9, 6, 5)), country= rep (c(' A ', ' B ', ' C ', ' D '), times =5)) #view data df order_num product country 1 1 TV A 2 2 TV B 3 3 TV C 4 4 TV D 5 5 TV A 6 6 TV B 7 7 TV C 8 8 TV D 9 9 TV A 10 10 Radio B 11 11 Radio C 12 12 Radio D 13 13 Radio A 14 14 Radio B 15 15 Radio C 16 16 Computer D 17 17 Computer A 18 18 Computer B 19 19 Computer C 20 20 Computer D
Щоб створити таблицю непередбачених обставин, ми можемо просто використати функцію table() і надати змінні продукту та країни як аргументи:
#create contingency table table <- table(df$product, df$country) #view contingency table table ABCD Computer 1 1 1 2 Radio 1 2 2 1 TV 3 2 2 2
Ми також можемо використовувати функцію addmargins() , щоб додати поля до таблиці:
#add margins to contingency table table_w_margins <- addmargins(table) #view contingency table table_w_margins ABCD Sum Computer 1 1 1 2 5 Radio 1 2 2 1 6 TV 3 2 2 2 9 Sum 5 5 5 5 20
Ось як інтерпретувати таблицю:
- Значення в нижньому правому куті вказує на загальну кількість замовлених товарів: 20.
- Значення в правій частині показують суми рядків: загалом було замовлено 5 комп’ютерів, 6 радіо та 9 телевізорів.
- Значення в нижній частині таблиці показують суми стовпців: загалом 5 продуктів було замовлено в країні A, 5 у країні B, 5 у країні C і 5 у країні D.
- Значення всередині таблиці вказують на кількість конкретних продуктів, замовлених у кожній країні: 1 комп’ютер з країни А, 1 радіо з країни А, 3 телевізори з країни А тощо.
Додаткові ресурси
Як усереднити стовпці в R
Як підсумувати певні стовпці в R
Як обчислити середнє значення кількох стовпців у R