So berechnen sie die standardabweichung von spalten in r
Sie können die folgende grundlegende Syntax verwenden, um die Standardabweichung von Spalten in R zu berechnen:
#calculate standard deviation of one column sd(df$col1) #calculate standard deviation of all columns sapply(df, sd) #calculate standard deviation of specific columns sapply(df[c(' col1 ', ' col2 ', ' col5 ')], sd)
Die folgenden Beispiele zeigen, wie diese Syntax in der Praxis mit dem folgenden Datenrahmen verwendet werden kann:
#create data frame df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'), points=c(99, 91, 86, 88, 95), assists=c(33, 28, 31, 39, 34), rebounds=c(30, 28, 24, 24, 28)) #view data frame df team points assists rebounds 1 A 99 33 30 2 B 91 28 28 3 C 86 31 24 4 D 88 39 24 5 E 95 34 28
Beispiel 1: Standardabweichung einer Spalte
Der folgende Code zeigt, wie die Standardabweichung einer Spalte im Datenrahmen berechnet wird:
#calculate standard deviation of 'points' column
sd(df$points)
[1] 5.263079
Die Standardabweichung der Werte in der Spalte „Punkte“ beträgt 5,263079 .
Beispiel 2: Standardabweichung aller Spalten
Der folgende Code zeigt, wie die Standardabweichung jeder Spalte im Datenrahmen berechnet wird:
#calculate standard deviation of all columns in data frame
sapply(df, sd)
team points assists rebounds
NA 5.263079 4.062019 2.683282
Warning message:
In var(if (is.vector(x) || is.factor(x)) x else as.double(x), na.rm = na.rm):
NAs introduced by coercion
Da die Spalte „Team“ eine Zeichenvariable ist, gibt R NA zurück und gibt uns eine Warnung.
Die Standardabweichung der anderen drei numerischen Spalten wird jedoch erfolgreich berechnet.
Beispiel 3: Standardabweichung bestimmter Spalten
Der folgende Code zeigt, wie die Standardabweichung bestimmter Spalten im Datenrahmen berechnet wird:
#calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(' points ', ' rebounds ')], sd)
rebound points
5.263079 2.683282
Beachten Sie, dass wir auch Spaltenindexwerte verwenden könnten, um Spalten auszuwählen:
#calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(2, 4)], sd)
rebound points
5.263079 2.683282
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere allgemeine Funktionen in R ausführen:
So berechnen Sie die Standardabweichung von Zeilen in R
So berechnen Sie den Durchschnitt mehrerer Spalten in R
So ermitteln Sie den Maximalwert über mehrere Spalten in R
So wählen Sie bestimmte Spalten in R aus