So erstellen sie relative häufigkeitstabellen in r


Eine relative Häufigkeitstabelle gibt Ihnen Auskunft darüber, wie oft bestimmte Werte in einem Datensatz im Verhältnis zur Gesamtzahl der Werte im Datensatz vorkommen.

Sie können die folgende grundlegende Syntax verwenden, um eine Häufigkeitstabelle in R zu erstellen:

 table(data)/length(data)

Die Funktion table() berechnet die Häufigkeit jedes einzelnen Datenwerts und die Funktion length() berechnet die Gesamtzahl der Werte im Datensatz.

Indem wir also jede einzelne Häufigkeit durch die Länge des Datensatzes dividieren, erhalten wir die relative Häufigkeit jedes Werts im Datensatz.

Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.

Beispiel 1: Relative Häufigkeitstabelle für einen Vektor

Der folgende Code zeigt, wie man eine relative Häufigkeitstabelle für einen einzelnen Vektor in R erstellt:

 #define data
data <- c('A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C')

#create relative frequency table
table(data)/length(data)

  ABC
0.2 0.3 0.5

So interpretieren Sie die Tabelle:

  • 20 % aller Werte im Datensatz sind der Buchstabe A
  • 30 % aller Werte im Datensatz sind der Buchstabe B
  • 50 % aller Werte im Datensatz sind der Buchstabe C

Beispiel 2: Relative Häufigkeitstabelle für eine Datenrahmenspalte

Der folgende Code zeigt, wie man eine relative Häufigkeitstabelle für eine Spalte eines Datenrahmens in R erstellt:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'),
                 wins=c(2, 9, 11, 12, 15, 17, 18, 19),
                 dots=c(1, 2, 2, 2, 3, 3, 3, 3))

#view first few rows of data frame
head(df)

  team wins points
1 to 2 1
2 to 9 2
3 to 11 2
4 to 12 2
5 to 15 3
6 B 17 3

#calculate relative frequency table for 'team' column
table(df$team)/length(df$team)
 
    ABC
0.625 0.250 0.125

Beispiel 3: Relative Häufigkeitstabelle für alle Spalten im Datenrahmen

Der folgende Code zeigt, wie man eine relative Häufigkeitstabelle für jede Spalte eines Datenrahmens in R erstellt:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'A', 'B', 'B', 'C'),
                 wins=c(2, 9, 11, 12, 15, 17, 18, 19),
                 dots=c(1, 2, 2, 2, 3, 3, 3, 3))

#calculate relative frequency table for each column
sapply(df, function (x) table(x)/nrow(df))

$team
x
    ABC
0.625 0.250 0.125 

$wins
x
    2 9 11 12 15 17 18 19 
0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125 

$points
x
    1 2 3 
0.125 0.375 0.500 

Zusätzliche Ressourcen

So erstellen Sie Häufigkeitstabellen in R
So erstellen Sie eine Häufigkeitstabelle mehrerer Variablen in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert