Hoe u een kruistabel maakt in r


Een kruistabel (ook wel kruistabellen genoemd) is een soort tabel die de relatie tussen twee categorische variabelen samenvat.

Gelukkig is het eenvoudig om een kruistabel voor variabelen in R te maken met behulp van de draaitabelfunctie. Deze tutorial toont een voorbeeld van hoe u dit kunt doen.

Voorbeeld: kruistabel in R

Laten we zeggen dat we de volgende dataset hebben die informatie weergeeft over twintig verschillende productbestellingen, inclusief het type gekochte product en het land waarin het product is gekocht:

 #create data
df <- data.frame(order_num = 1:20,
                 product= rep (c(' TV ', ' Radio ', ' Computer '), times =c(9, 6, 5)),
                 country= rep (c(' A ', ' B ', ' C ', ' D '), times =5))

#view data
df

   order_num product country
1 1 TV A
2 2 TV B
3 3 TV C
4 4 TV D
5 5 TV A
6 6 TV B
7 7 TV C
8 8 TV D
9 9 TV A
10 10 Radio B
11 11 Radio C
12 12 Radio D
13 13 Radio A
14 14 Radio B
15 15 Radio C
16 16 Computer D
17 17 Computer A
18 18 Computer B
19 19 Computer C
20 20 Computer D

Om een kruistabel te maken, kunnen we eenvoudigweg de functie table() gebruiken en de product- en landvariabelen als argumenten opgeven:

 #create contingency table
table <- table(df$product, df$country)

#view contingency table
table

           ABCD
  Computer 1 1 1 2
  Radio 1 2 2 1
  TV 3 2 2 2

We kunnen ook de functie addmargins() gebruiken om marges aan de tabel toe te voegen:

 #add margins to contingency table
table_w_margins <- addmargins(table)

#view contingency table
table_w_margins

            ABCD Sum
  Computer 1 1 1 2 5
  Radio 1 2 2 1 6
  TV 3 2 2 2 9
  Sum 5 5 5 5 20

Zo interpreteert u de tabel:

  • De waarde in de rechter benedenhoek geeft het totaal aantal bestelde producten aan: 20.
  • De waarden aan de rechterkant tonen de som van de rijen: In totaal zijn er 5 computers besteld, 6 radio’s besteld en 9 televisies besteld.
  • De waarden onderaan de tabel tonen de som van de kolommen: in totaal zijn er 5 producten besteld in land A, 5 in land B, 5 in land C en 5 in land D.
  • De waarden in de tabel geven het aantal specifieke producten aan dat in elk land is besteld: 1 computer uit land A, 1 radio uit land A, 3 televisies uit land A, enz.

Aanvullende bronnen

Hoe u het gemiddelde kunt nemen over kolommen in R
Hoe specifieke kolommen in R op te tellen
Hoe het gemiddelde van meerdere kolommen in R te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert