Jak utworzyć tabelę kontyngencji w r


Tabela kontyngencji (czasami nazywana „tabelami przestawnymi”) to rodzaj tabeli podsumowującej relacje między dwiema zmiennymi kategorycznymi.

Na szczęście łatwo jest utworzyć tabelę kontyngencji dla zmiennych w R za pomocą funkcji tabeli przestawnej. W tym samouczku pokazano przykład, jak to zrobić.

Przykład: tabela kontyngencji w R

Załóżmy, że mamy następujący zbiór danych, który wyświetla informacje o 20 różnych zamówieniach produktów, w tym rodzaj zakupionego produktu oraz kraj, w którym produkt został zakupiony:

 #create data
df <- data.frame(order_num = 1:20,
                 product= rep (c(' TV ', ' Radio ', ' Computer '), times =c(9, 6, 5)),
                 country= rep (c(' A ', ' B ', ' C ', ' D '), times =5))

#view data
df

   order_num product country
1 1 TV A
2 2 TV B
3 3 TV C
4 4 TV D
5 5 TV A
6 6 TV B
7 7 TV C
8 8 TV D
9 9 TV A
10 10 Radio B
11 11 Radio C
12 12 Radio D
13 13 Radio A
14 14 Radio B
15 15 Radio C
16 16 Computer D
17 17 Computer A
18 18 Computer B
19 19 Computer C
20 20 Computer D

Aby utworzyć tabelę kontyngencji, możemy po prostu użyć funkcji table() i podać zmienne produktu i kraju jako argumenty:

 #create contingency table
table <- table(df$product, df$country)

#view contingency table
table

           ABCD
  Computer 1 1 1 2
  Radio 1 2 2 1
  TV 3 2 2 2

Możemy także użyć funkcji addmargins() , aby dodać marginesy do tabeli:

 #add margins to contingency table
table_w_margins <- addmargins(table)

#view contingency table
table_w_margins

            ABCD Sum
  Computer 1 1 1 2 5
  Radio 1 2 2 1 6
  TV 3 2 2 2 9
  Sum 5 5 5 5 20

Oto jak interpretować tabelę:

  • Wartość w prawym dolnym rogu oznacza całkowitą ilość zamówionych produktów: 20.
  • Wartości po prawej stronie pokazują sumy wierszy: Łącznie zamówiono 5 komputerów, 6 radioodbiorników i 9 telewizorów.
  • Wartości na dole tabeli przedstawiają sumę kolumn: łącznie zamówiono 5 produktów w kraju A, 5 w kraju B, 5 w kraju C i 5 w kraju D.
  • Wartości wewnątrz tabeli wskazują ilość konkretnych produktów zamawianych w każdym kraju: 1 komputer z kraju A, 1 radio z kraju A, 3 telewizory z kraju A itd.

Dodatkowe zasoby

Jak uśredniać kolumny w R
Jak sumować określone kolumny w R
Jak obliczyć średnią z wielu kolumn w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *