Jak utworzyć tabelę kontyngencji w r
Tabela kontyngencji (czasami nazywana „tabelami przestawnymi”) to rodzaj tabeli podsumowującej relacje między dwiema zmiennymi kategorycznymi.
Na szczęście łatwo jest utworzyć tabelę kontyngencji dla zmiennych w R za pomocą funkcji tabeli przestawnej. W tym samouczku pokazano przykład, jak to zrobić.
Przykład: tabela kontyngencji w R
Załóżmy, że mamy następujący zbiór danych, który wyświetla informacje o 20 różnych zamówieniach produktów, w tym rodzaj zakupionego produktu oraz kraj, w którym produkt został zakupiony:
#create data df <- data.frame(order_num = 1:20, product= rep (c(' TV ', ' Radio ', ' Computer '), times =c(9, 6, 5)), country= rep (c(' A ', ' B ', ' C ', ' D '), times =5)) #view data df order_num product country 1 1 TV A 2 2 TV B 3 3 TV C 4 4 TV D 5 5 TV A 6 6 TV B 7 7 TV C 8 8 TV D 9 9 TV A 10 10 Radio B 11 11 Radio C 12 12 Radio D 13 13 Radio A 14 14 Radio B 15 15 Radio C 16 16 Computer D 17 17 Computer A 18 18 Computer B 19 19 Computer C 20 20 Computer D
Aby utworzyć tabelę kontyngencji, możemy po prostu użyć funkcji table() i podać zmienne produktu i kraju jako argumenty:
#create contingency table table <- table(df$product, df$country) #view contingency table table ABCD Computer 1 1 1 2 Radio 1 2 2 1 TV 3 2 2 2
Możemy także użyć funkcji addmargins() , aby dodać marginesy do tabeli:
#add margins to contingency table table_w_margins <- addmargins(table) #view contingency table table_w_margins ABCD Sum Computer 1 1 1 2 5 Radio 1 2 2 1 6 TV 3 2 2 2 9 Sum 5 5 5 5 20
Oto jak interpretować tabelę:
- Wartość w prawym dolnym rogu oznacza całkowitą ilość zamówionych produktów: 20.
- Wartości po prawej stronie pokazują sumy wierszy: Łącznie zamówiono 5 komputerów, 6 radioodbiorników i 9 telewizorów.
- Wartości na dole tabeli przedstawiają sumę kolumn: łącznie zamówiono 5 produktów w kraju A, 5 w kraju B, 5 w kraju C i 5 w kraju D.
- Wartości wewnątrz tabeli wskazują ilość konkretnych produktów zamawianych w każdym kraju: 1 komputer z kraju A, 1 radio z kraju A, 3 telewizory z kraju A itd.
Dodatkowe zasoby
Jak uśredniać kolumny w R
Jak sumować określone kolumny w R
Jak obliczyć średnią z wielu kolumn w R