So erstellen sie relative häufigkeitstabellen in r
Eine relative Häufigkeitstabelle gibt Ihnen Auskunft darüber, wie oft bestimmte Werte in einem Datensatz im Verhältnis zur Gesamtzahl der Werte im Datensatz vorkommen.
Sie können die folgende grundlegende Syntax verwenden, um eine Häufigkeitstabelle in R zu erstellen:
table(data)/length(data)
Die Funktion table() berechnet die Häufigkeit jedes einzelnen Datenwerts und die Funktion length() berechnet die Gesamtzahl der Werte im Datensatz.
Indem wir also jede einzelne Häufigkeit durch die Länge des Datensatzes dividieren, erhalten wir die relative Häufigkeit jedes Werts im Datensatz.
Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.
Beispiel 1: Relative Häufigkeitstabelle für einen Vektor
Der folgende Code zeigt, wie man eine relative Häufigkeitstabelle für einen einzelnen Vektor in R erstellt:
#define data data <- c('A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C') #create relative frequency table table(data)/length(data) ABC 0.2 0.3 0.5
So interpretieren Sie die Tabelle:
- 20 % aller Werte im Datensatz sind der Buchstabe A
- 30 % aller Werte im Datensatz sind der Buchstabe B
- 50 % aller Werte im Datensatz sind der Buchstabe C
Beispiel 2: Relative Häufigkeitstabelle für eine Datenrahmenspalte
Der folgende Code zeigt, wie man eine relative Häufigkeitstabelle für eine Spalte eines Datenrahmens in R erstellt:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'), wins=c(2, 9, 11, 12, 15, 17, 18, 19), dots=c(1, 2, 2, 2, 3, 3, 3, 3)) #view first few rows of data frame head(df) team wins points 1 to 2 1 2 to 9 2 3 to 11 2 4 to 12 2 5 to 15 3 6 B 17 3 #calculate relative frequency table for 'team' column table(df$team)/length(df$team) ABC 0.625 0.250 0.125
Beispiel 3: Relative Häufigkeitstabelle für alle Spalten im Datenrahmen
Der folgende Code zeigt, wie man eine relative Häufigkeitstabelle für jede Spalte eines Datenrahmens in R erstellt:
#define data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'), wins=c(2, 9, 11, 12, 15, 17, 18, 19), dots=c(1, 2, 2, 2, 3, 3, 3, 3)) #calculate relative frequency table for each column sapply(df, function (x) table(x)/nrow(df)) $team x ABC 0.625 0.250 0.125 $wins x 2 9 11 12 15 17 18 19 0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125 $points x 1 2 3 0.125 0.375 0.500
Zusätzliche Ressourcen
So erstellen Sie Häufigkeitstabellen in R
So erstellen Sie eine Häufigkeitstabelle mehrerer Variablen in R