So mitteln sie den durchschnitt über spalten in r (mit beispielen)


Häufig möchten Sie möglicherweise Werte über mehrere Spalten in R mitteln. Glücklicherweise ist dies mit der Funktion rowMeans() einfach zu bewerkstelligen.

Dieses Tutorial zeigt einige Beispiele für die praktische Verwendung dieser Funktion.

Beispiel 1: Ermitteln Sie den Durchschnitt über alle Spalten

Der folgende Code zeigt, wie der Durchschnittswert jeder Zeile über alle Spalten in einem Datenrahmen berechnet wird:

 #create data frame
data <- data.frame(var1 = c(0, NA, 2, 2, 5),
                   var2 = c(5, 5, 7, 8, 9),
                   var3 = c(2, 7, 9, 9, 7))

#view data frame
data

  var1 var2 var3
1 0 5 2
2 NA 5 7
3 2 7 9
4 2 8 9
5 5 9 7

#find average value in each row
rowMeans(data, na.rm= TRUE )

[1] 2.333333 6.000000 6.000000 6.333333 7.000000

Das Ergebnis lässt sich wie folgt interpretieren:

  • Der Durchschnittswert in der ersten Zeile beträgt 2,333 .
  • Der Durchschnittswert in der zweiten Zeile beträgt 6 .
  • Der Durchschnittswert in der dritten Zeile beträgt 6 .
  • Der Durchschnittswert in der vierten Reihe beträgt 6,333 .
  • Der Durchschnittswert in der fünften Reihe beträgt 7 .

Sie können diese Zeilendurchschnitte auch einer neuen Variablen im Datenrahmen zuweisen:

 #assign row averages to new variable named row_mean
data$row_mean <- rowMeans(data, na.rm= TRUE )

#view data frame
data

  var1 var2 var3 row_mean
1 0 5 2 2.333333
2 NA 5 7 6.000000
3 2 7 9 6.000000
4 2 8 9 6.333333
5 5 9 7 7.000000

Beispiel 2: Ermitteln Sie den Durchschnitt für bestimmte Spalten

Es ist auch möglich, den Durchschnitt nur für bestimmte Spalten eines Datenrahmens zu ermitteln. Der folgende Code zeigt beispielsweise, wie Zeilendurchschnitte nur für die ersten beiden Spalten berechnet werden:

 #find row averages across first two columns
data$new <- rowMeans(data[, c(1,2)], na.rm= TRUE )

#view data frame
data

  var1 var2 var3 new
1 0 5 2 2.5
2 NA 5 7 5.0
3 2 7 9 4.5
4 2 8 9 5.0
5 5 9 7 7.0

Wir können Folgendes sehen:

  • Der Durchschnittswert der ersten Zeile der ersten beiden Spalten beträgt 2,5 .
  • Der Durchschnittswert der zweiten Zeile der ersten beiden Spalten beträgt 5 .

Und so weiter.

Sie können eine ähnliche Syntax verwenden, um Zeilendurchschnitte für beliebige Spaltensätze zu ermitteln. Der folgende Code zeigt beispielsweise, wie Zeilendurchschnitte nur für die erste und dritte Spalte berechnet werden:

 #find row averages across first and third columns
data$new <- rowMeans(data[, c(1,3)], na.rm= TRUE )

#view data frame
data

  var1 var2 var3 new
1 0 5 2 1.0
2 NA 5 7 7.0
3 2 7 9 5.5
4 2 8 9 5.5
5 5 9 7 6.0

Wir können Folgendes sehen:

  • Der Durchschnittswert der ersten Zeile der ersten und dritten Spalte beträgt 1 .
  • Der Durchschnittswert in der zweiten Zeile der ersten und dritten Spalte beträgt 7 .

Und so weiter.

Weitere R-Tutorials finden Sie hier .

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert