Standaardafwijking berekenen met dplyr (met voorbeelden)


U kunt de volgende methoden gebruiken om de standaardafwijking van waarden in een dataframe in dplyr te berekenen:

Methode 1: Bereken de standaarddeviatie van een variabele

 library (dplyr)

df %>%
  summarise(sd_var1 = sd(var1, na. rm = TRUE ))

Methode 2: Bereken de standaardafwijking van meerdere variabelen

 library (dplyr)

df %>%
  summarize(sd_var1 = sd(var1, na. rm = TRUE ),
            sd_var2 = sd(var2, na. rm = TRUE ))

Methode 3: bereken de standaardafwijking van meerdere variabelen, gegroepeerd op een andere variabele

 library (dplyr)

df %>%
  group_by(var3) %>%
  summarize(sd_var1 = sd(var1, na. rm = TRUE ),
            sd_var2 = sd(var2, na. rm = TRUE ))

In deze tutorial wordt uitgelegd hoe u elke methode in de praktijk kunt gebruiken met het volgende dataframe in R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(12, 15, 18, 22, 14, 17, 29, 35),
                 assists=c(4, 4, 3, 6, 7, 8, 3, 10))

#view data frame
df

  team points assists
1 to 12 4
2 to 15 4
3 To 18 3
4 to 22 6
5 B 14 7
6 B 17 8
7 B 29 3
8 B 35 10

Voorbeeld 1: Bereken de standaardafwijking van een variabele

De volgende code laat zien hoe u de standaardafwijking van de puntenvariabele berekent:

 library (dplyr)

#calculate standard deviation of points variable
df %>%
  summarise(sd_points = sd(points, na. rm = TRUE ))

  sd_points
1 7.995534

Uit het resultaat kunnen we zien dat de standaardafwijking van de waarden van de puntenvariabele 7,995534 is.

Voorbeeld 2: Bereken de standaardafwijking van verschillende variabelen

De volgende code laat zien hoe u de standaardafwijking van punten en hulpvariabelen kunt berekenen:

 library (dplyr)

#calculate standard deviation of points and assists variables
df %>%
  summarise(sd_points = sd(points, na. rm = TRUE ),
            sd_assists = sd(assists, na. rm = TRUE ))

  sd_points sd_assists
1 7.995534 2.559994

De uitvoer toont de standaardafwijking voor de punten en hulpvariabelen .

Voorbeeld 3: bereken de standaardafwijking van verschillende variabelen, gegroepeerd door een andere variabele

De volgende code laat zien hoe u de standaardafwijking van punten en hulpvariabelen kunt berekenen:

 library (dplyr)

#calculate standard deviation of points and assists variables
df %>%
  group_by(team) %>%
  summarise(sd_points = sd(points, na. rm = TRUE ),
            sd_assists = sd(assists, na. rm = TRUE ))

# A tibble: 2 x 3
  team sd_points sd_assists
             
1 A 4.27 1.26
2B 9.91 2.94

Het resultaat toont de standaardafwijking voor de punten en hulpvariabelen voor Team A en Team B.

Opmerking : u kunt een lijst met meerdere variabelen opnemen in de functie group_by() als u op meerdere variabelen wilt groeperen.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:

Hoe unieke waarden te filteren met dplyr
Hoe u op meerdere voorwaarden kunt filteren met behulp van dplyr
Hoe het aantal exemplaren in kolommen in R te tellen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert