So erstellen sie eine häufigkeitstabelle mehrerer variablen in r


Um eine Häufigkeitstabelle für mehrere Variablen in einem Datenrahmen in R zu berechnen, können Sie die Funktion apply() verwenden, die die folgende Syntax verwendet:

anwenden (X, FUN MARGIN)

Gold:

  • X: ein Array, eine Matrix oder ein Datenblock
  • MARGIN: Wenden Sie eine Funktion auf Zeilen (1) oder Spalten (2) an.
  • SPASS: Die anzuwendende Funktion

Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.

Beispiel 1: Häufigkeitstabelle für alle Variablen in R

Der folgende Code zeigt, wie eine Häufigkeitstabelle für jede Variable in einem Datenrahmen berechnet wird:

 #create data frame
df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#view first few rows of data frame
head(df)

  var1 var2 var3
1 1 To 6
2 1 A 7
3 2 To 7
4 2 To 7
5 2 B 8
6 2 B 8

#calculate frequency table for every variable in data frame
apply((df), 2, table)

$var1

1 2 3 
2 4 1 

$var2

AB
4 3 

$var3

6 7 8 9 
1 3 2 1

Das Ergebnis sind drei Häufigkeitstabellen – eine für jede Variable im Datenrahmen.

So interpretieren Sie die erste Häufigkeitstabelle:

  • Der Wert 1 erscheint zweimal in der Spalte „var1“.
  • Der Wert 2 erscheint viermal in der Spalte „var2“.
  • Der Wert 3 erscheint 1 Mal in der Spalte „var3“.

Die anderen Häufigkeitstabellen können auf die gleiche Weise interpretiert werden.

Beispiel 2: Häufigkeitstabelle für bestimmte Variablen in R

Der folgende Code zeigt, wie eine Häufigkeitstabelle für bestimmte Variablen in einem Datenrahmen berechnet wird

 #create data frame
df <- data. frame (var1=c(1, 1, 2, 2, 2, 2, 3),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#calculate frequency table for var1 and var3 columns
apply((df[c(' var1 ', ' var3 ')]), 2, table)

$var1

1 2 3 
2 4 1

$var3

6 7 8 9 
1 3 2 1

Beispiel 3: Häufigkeitstabelle für alle bis auf eine Variable in R

Angenommen, wir haben eine Indexspalte in einem Datenrahmen und möchten eine Häufigkeitstabelle für jede Variable im Datenrahmen außer der Indexspalte berechnen.

Der folgende Code zeigt, wie das geht:

 #create data frame
df <- data. frame (index=c(1, 2, 3, 4, 5, 6, 7),
                 var2=c('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3=c(6, 7, 7, 7, 8, 8, 9))

#calculate frequency table for all columns except index column
apply((df[-1]), 2, table)

$var2

AB
4 3 

$var3

6 7 8 9 
1 3 2 1

Zusätzliche Ressourcen

So erstellen Sie eine Zwei-Wege-Tabelle in R
So erstellen Sie ein relatives Häufigkeitshistogramm in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert