So berechnen sie die standardabweichung von spalten in r


Sie können die folgende grundlegende Syntax verwenden, um die Standardabweichung von Spalten in R zu berechnen:

 #calculate standard deviation of one column
sd(df$col1)

#calculate standard deviation of all columns
sapply(df, sd)

#calculate standard deviation of specific columns
sapply(df[c(' col1 ', ' col2 ', ' col5 ')], sd)

Die folgenden Beispiele zeigen, wie diese Syntax in der Praxis mit dem folgenden Datenrahmen verwendet werden kann:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#view data frame
df

  team points assists rebounds
1 A 99 33 30
2 B 91 28 28
3 C 86 31 24
4 D 88 39 24
5 E 95 34 28

Beispiel 1: Standardabweichung einer Spalte

Der folgende Code zeigt, wie die Standardabweichung einer Spalte im Datenrahmen berechnet wird:

 #calculate standard deviation of 'points' column
sd(df$points)

[1] 5.263079

Die Standardabweichung der Werte in der Spalte „Punkte“ beträgt 5,263079 .

Beispiel 2: Standardabweichung aller Spalten

Der folgende Code zeigt, wie die Standardabweichung jeder Spalte im Datenrahmen berechnet wird:

 #calculate standard deviation of all columns in data frame
sapply(df, sd)

    team points assists rebounds 
      NA 5.263079 4.062019 2.683282 
Warning message:
In var(if (is.vector(x) || is.factor(x)) x else as.double(x), na.rm = na.rm):
  NAs introduced by coercion

Da die Spalte „Team“ eine Zeichenvariable ist, gibt R NA zurück und gibt uns eine Warnung.

Die Standardabweichung der anderen drei numerischen Spalten wird jedoch erfolgreich berechnet.

Beispiel 3: Standardabweichung bestimmter Spalten

Der folgende Code zeigt, wie die Standardabweichung bestimmter Spalten im Datenrahmen berechnet wird:

 #calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(' points ', ' rebounds ')], sd)

  rebound points 
5.263079 2.683282

Beachten Sie, dass wir auch Spaltenindexwerte verwenden könnten, um Spalten auszuwählen:

 #calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(2, 4)], sd)

  rebound points 
5.263079 2.683282

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere allgemeine Funktionen in R ausführen:

So berechnen Sie die Standardabweichung von Zeilen in R
So berechnen Sie den Durchschnitt mehrerer Spalten in R
So ermitteln Sie den Maximalwert über mehrere Spalten in R
So wählen Sie bestimmte Spalten in R aus

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert