Hoe de standaarddeviatie in r te berekenen (met voorbeelden)


U kunt de volgende syntaxis gebruiken om de standaardafwijking van een vector in R te berekenen:

 sd(x)

Merk op dat deze formule de standaarddeviatie van het monster berekent met behulp van de volgende formule:

Σ (x ik – μ) 2 / (n-1)

Goud:

  • Σ : Een mooi symbool dat “som” betekent
  • x i : de i- de waarde van de dataset
  • μ : De gemiddelde waarde van de dataset
  • n: De steekproefomvang

De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.

Voorbeeld 1: Bereken de standaardafwijking van de vector

De volgende code laat zien hoe je de standaardafwijking van een enkele vector in R kunt berekenen:

 #create dataset
data <- c(1, 3, 4, 6, 11, 14, 17, 20, 22, 23)

#find standard deviation
sd(data)

[1] 8.279157

Merk op dat u na.rm = TRUE moet gebruiken om de standaardafwijking te berekenen als er ontbrekende waarden in de dataset zijn:

 #create dataset with missing values
data <- c(1, 3, 4, 6, NA, 14, NA, 20, 22, 23)

#attempt to find standard deviation
sd(data)

[1] NA

#find standard deviation and specify to ignore missing values
sd(data, na. rm = TRUE )

[1] 9.179753

Voorbeeld 2: Bereken de standaardafwijking van een kolom in een dataframe

De volgende code laat zien hoe u de standaardafwijking van een enkele kolom in een gegevensframe kunt berekenen:

 #create data frame
data <- data. frame (a=c(1, 3, 4, 6, 8, 9),
                   b=c(7, 8, 8, 7, 13, 16),
                   c=c(11, 13, 13, 18, 19, 22),
                   d=c(12, 16, 18, 22, 29, 38))

#find standard deviation of column a
sd(data$a)

[1] 3.060501

Voorbeeld 3: Bereken de standaardafwijking van meerdere kolommen in een dataframe

De volgende code laat zien hoe u de standaardafwijking van meerdere kolommen in een gegevensframe kunt berekenen:

 #create data frame
data <- data. frame (a=c(1, 3, 4, 6, 8, 9),
                   b=c(7, 8, 8, 7, 13, 16),
                   c=c(11, 13, 13, 18, 19, 22),
                   d=c(12, 16, 18, 22, 29, 38))

#find standard deviation of specific columns in data frame
apply(data[, c(' a ', ' c ', ' d ')], 2, sd)

       acd
3.060501 4.289522 9.544632

Aanvullende bronnen

Hoe bereik te vinden in R
Hoe de steekproef- en populatievariantie in R te berekenen
Hoe uitschieters in R te verwijderen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert