So erstellen sie eine kontingenztabelle in r


Eine Kontingenztabelle (manchmal auch „Kreuztabellen“ genannt) ist eine Art Tabelle, die die Beziehung zwischen zwei kategorialen Variablen zusammenfasst.

Glücklicherweise ist es einfach, mit der Pivot-Tabellenfunktion eine Kontingenztabelle für Variablen in R zu erstellen. Dieses Tutorial zeigt ein Beispiel dafür.

Beispiel: Kontingenztabelle in R

Nehmen wir an, wir haben den folgenden Datensatz, der Informationen zu 20 verschiedenen Produktbestellungen anzeigt, einschließlich der Art des gekauften Produkts sowie des Landes, in dem das Produkt gekauft wurde:

 #create data
df <- data.frame(order_num = 1:20,
                 product= rep (c(' TV ', ' Radio ', ' Computer '), times =c(9, 6, 5)),
                 country= rep (c(' A ', ' B ', ' C ', ' D '), times =5))

#view data
df

   order_num product country
1 1 TV A
2 2 TV B
3 3 TV C
4 4 TV D
5 5 TV A
6 6 TV B
7 7 TV C
8 8 TV D
9 9 TV A
10 10 Radio B
11 11 Radio C
12 12 Radio D
13 13 Radio A
14 14 Radio B
15 15 Radio C
16 16 Computer D
17 17 Computer A
18 18 Computer B
19 19 Computer C
20 20 Computer D

Um eine Kontingenztabelle zu erstellen, können wir einfach die Funktion table() verwenden und die Produkt- und Ländervariablen als Argumente angeben:

 #create contingency table
table <- table(df$product, df$country)

#view contingency table
table

           ABCD
  Computer 1 1 1 2
  Radio 1 2 2 1
  TV 3 2 2 2

Wir können auch die Funktion addmargins() verwenden, um Ränder zur Tabelle hinzuzufügen:

 #add margins to contingency table
table_w_margins <- addmargins(table)

#view contingency table
table_w_margins

            ABCD Sum
  Computer 1 1 1 2 5
  Radio 1 2 2 1 6
  TV 3 2 2 2 9
  Sum 5 5 5 5 20

So interpretieren Sie die Tabelle:

  • Der Wert in der unteren rechten Ecke gibt die Gesamtzahl der bestellten Produkte an: 20.
  • Die Werte auf der rechten Seite zeigen die Summen der Zeilen: Insgesamt wurden 5 Computer, 6 Radios und 9 Fernseher bestellt.
  • Die Werte am Ende der Tabelle zeigen die Summen der Spalten: Insgesamt wurden 5 Produkte in Land A, 5 in Land B, 5 in Land C und 5 in Land D bestellt.
  • Die Werte in der Tabelle geben die Anzahl der in jedem Land bestellten spezifischen Produkte an: 1 Computer aus Land A, 1 Radio aus Land A, 3 Fernseher aus Land A usw.

Zusätzliche Ressourcen

So mitteln Sie den Durchschnitt über Spalten in R
So summieren Sie bestimmte Spalten in R
So berechnen Sie den Durchschnitt mehrerer Spalten in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert