So berechnen sie die standardabweichung in r (mit beispielen)


Mit der folgenden Syntax können Sie die Standardabweichung eines Vektors in R berechnen:

 sd(x)

Beachten Sie, dass diese Formel die Stichprobenstandardabweichung anhand der folgenden Formel berechnet:

Σ (x i – μ) 2 / (n-1)

Gold:

  • Σ : Ein ausgefallenes Symbol, das „Summe“ bedeutet
  • x i : der i-te Wert des Datensatzes
  • μ : Der Durchschnittswert des Datensatzes
  • n: Die Stichprobengröße

Die folgenden Beispiele zeigen, wie Sie diese Funktion in der Praxis nutzen können.

Beispiel 1: Berechnen Sie die Standardabweichung des Vektors

Der folgende Code zeigt, wie die Standardabweichung eines einzelnen Vektors in R berechnet wird:

 #create dataset
data <- c(1, 3, 4, 6, 11, 14, 17, 20, 22, 23)

#find standard deviation
sd(data)

[1] 8.279157

Beachten Sie, dass Sie na.rm = TRUE verwenden müssen, um die Standardabweichung zu berechnen, wenn im Datensatz fehlende Werte vorhanden sind:

 #create dataset with missing values
data <- c(1, 3, 4, 6, NA, 14, NA, 20, 22, 23)

#attempt to find standard deviation
sd(data)

[1] NA

#find standard deviation and specify to ignore missing values
sd(data, na. rm = TRUE )

[1] 9.179753

Beispiel 2: Berechnen Sie die Standardabweichung einer Spalte in einem Datenrahmen

Der folgende Code zeigt, wie die Standardabweichung einer einzelnen Spalte in einem Datenrahmen berechnet wird:

 #create data frame
data <- data. frame (a=c(1, 3, 4, 6, 8, 9),
                   b=c(7, 8, 8, 7, 13, 16),
                   c=c(11, 13, 13, 18, 19, 22),
                   d=c(12, 16, 18, 22, 29, 38))

#find standard deviation of column a
sd(data$a)

[1] 3.060501

Beispiel 3: Berechnen Sie die Standardabweichung mehrerer Spalten in einem Datenrahmen

Der folgende Code zeigt, wie die Standardabweichung mehrerer Spalten in einem Datenrahmen berechnet wird:

 #create data frame
data <- data. frame (a=c(1, 3, 4, 6, 8, 9),
                   b=c(7, 8, 8, 7, 13, 16),
                   c=c(11, 13, 13, 18, 19, 22),
                   d=c(12, 16, 18, 22, 29, 38))

#find standard deviation of specific columns in data frame
apply(data[, c(' a ', ' c ', ' d ')], 2, sd)

       acd
3.060501 4.289522 9.544632

Zusätzliche Ressourcen

So finden Sie den Bereich in R
So berechnen Sie die Stichproben- und Populationsvarianz in R
So entfernen Sie Ausreißer in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert