So berechnen sie den durchschnitt einer spalte in r (mit beispielen)


Sie können eine der folgenden Methoden verwenden, um den Durchschnitt einer Spalte in R zu berechnen:

 #calculate mean using column name
mean(df$my_column)

#calculate mean using column name (ignore missing values)
mean(df$my_column, na. rm = TRUE )

#calculate mean using column position
mean(df[, 1])

#calculation mean of all numeric columns
colMeans(df[sapply(df, is. numeric )])

Die folgenden Beispiele zeigen, wie jede Methode mit dem folgenden Datenrahmen in R verwendet wird:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 points=c(99, 90, 93, 86, 88, 82),
                 assists=c(33, 28, 31, 39, NA, 30))

#view data frame
df

  team points assists
1 A 99 33
2 A 90 28
3 A 93 31
4 B 86 39
5 B 88 NA
6 B 82 30

Beispiel 1: Berechnen Sie den Durchschnitt anhand des Spaltennamens

Der folgende Code zeigt, wie der Durchschnitt der Spalte „Punkte“ anhand des Spaltennamens berechnet wird:

 #calculate mean of 'points' column
mean(df$points)

[1] 89.66667

Der Durchschnittswert in der Spalte „Punkte“ beträgt 89,66667 .

Beispiel 2: Durchschnitt anhand des Spaltennamens berechnen (fehlende Werte ignorieren)

Wenn wir versuchen, den Durchschnitt einer Spalte mit fehlenden Werten zu berechnen, erhalten wir NA :

 #attempt to calculate mean of 'assists' column
mean(df$assists)

[1] NA

Wir müssen na.rm=TRUE verwenden, um fehlende Werte bei der Berechnung des Spaltendurchschnitts zu ignorieren:

 #calculate mean of 'assists' column and ignore missing values
mean(df$assists, na. rm = TRUE )

[1] 32.2

Der Durchschnittswert in der Spalte „Assists“ liegt bei 32,2 .

Beispiel 3: Berechnen Sie den Durchschnitt anhand der Spaltenposition

Der folgende Code zeigt, wie der Durchschnitt der Spalte an Indexposition 2 berechnet wird:

 #calculate mean of column in index position 2
mean(df[, 2])

[1] 89.66667

Der Durchschnittswert der Spalte an Indexposition 2 (die Spalte „Punkte“) beträgt 89,66667 .

Beispiel 4: Berechnen Sie den Durchschnitt aller numerischen Spalten

Der folgende Code zeigt, wie der Durchschnitt aller numerischen Spalten im Datenrahmen berechnet wird:

 #calculate mean of all numeric columns
colMeans(df[sapply(df, is. numeric )], na. rm = TRUE )

  assist points 
89.66667 32.20000

Die Ausgabe zeigt den Durchschnittswert jeder numerischen Spalte im Datenrahmen an.

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie man andere Durchschnittswerte in R berechnet:

So berechnen Sie einen getrimmten Mittelwert in R
So berechnen Sie den geometrischen Mittelwert in R
So berechnen Sie einen gewichteten Durchschnitt in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert