So erstellen sie eine häufigkeitstabelle mehrerer variablen in r
Um eine Häufigkeitstabelle für mehrere Variablen in einem Datenrahmen in R zu berechnen, können Sie die Funktion apply() verwenden, die die folgende Syntax verwendet:
anwenden (X, FUN MARGIN)
Gold:
- X: ein Array, eine Matrix oder ein Datenblock
- MARGIN: Wenden Sie eine Funktion auf Zeilen (1) oder Spalten (2) an.
- SPASS: Die anzuwendende Funktion
Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.
Beispiel 1: Häufigkeitstabelle für alle Variablen in R
Der folgende Code zeigt, wie eine Häufigkeitstabelle für jede Variable in einem Datenrahmen berechnet wird:
#create data frame df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3), var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'), var3=c(6, 7, 7, 7, 8, 8, 9)) #view first few rows of data frame head(df) var1 var2 var3 1 1 To 6 2 1 A 7 3 2 To 7 4 2 To 7 5 2 B 8 6 2 B 8 #calculate frequency table for every variable in data frame apply((df), 2, table) $var1 1 2 3 2 4 1 $var2 AB 4 3 $var3 6 7 8 9 1 3 2 1
Das Ergebnis sind drei Häufigkeitstabellen – eine für jede Variable im Datenrahmen.
So interpretieren Sie die erste Häufigkeitstabelle:
- Der Wert 1 erscheint zweimal in der Spalte „var1“.
- Der Wert 2 erscheint viermal in der Spalte „var2“.
- Der Wert 3 erscheint 1 Mal in der Spalte „var3“.
Die anderen Häufigkeitstabellen können auf die gleiche Weise interpretiert werden.
Beispiel 2: Häufigkeitstabelle für bestimmte Variablen in R
Der folgende Code zeigt, wie eine Häufigkeitstabelle für bestimmte Variablen in einem Datenrahmen berechnet wird
#create data frame df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3), var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'), var3=c(6, 7, 7, 7, 8, 8, 9)) #calculate frequency table for var1 and var3 columns apply((df[c(' var1 ', ' var3 ')]), 2, table) $var1 1 2 3 2 4 1 $var3 6 7 8 9 1 3 2 1
Beispiel 3: Häufigkeitstabelle für alle bis auf eine Variable in R
Angenommen, wir haben eine Indexspalte in einem Datenrahmen und möchten eine Häufigkeitstabelle für jede Variable im Datenrahmen außer der Indexspalte berechnen.
Der folgende Code zeigt, wie das geht:
#create data frame df <- data. frame (index=c(1, 2, 3, 4, 5, 6, 7), var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'), var3=c(6, 7, 7, 7, 8, 8, 9)) #calculate frequency table for all columns except index column apply((df[-1]), 2, table) $var2 AB 4 3 $var3 6 7 8 9 1 3 2 1
Zusätzliche Ressourcen
So erstellen Sie eine Zwei-Wege-Tabelle in R
So erstellen Sie ein relatives Häufigkeitshistogramm in R