Standaardafwijking berekenen met dplyr (met voorbeelden)
U kunt de volgende methoden gebruiken om de standaardafwijking van waarden in een dataframe in dplyr te berekenen:
Methode 1: Bereken de standaarddeviatie van een variabele
library (dplyr) df %>% summarise(sd_var1 = sd(var1, na. rm = TRUE ))
Methode 2: Bereken de standaardafwijking van meerdere variabelen
library (dplyr) df %>% summarize(sd_var1 = sd(var1, na. rm = TRUE ), sd_var2 = sd(var2, na. rm = TRUE ))
Methode 3: bereken de standaardafwijking van meerdere variabelen, gegroepeerd op een andere variabele
library (dplyr) df %>% group_by(var3) %>% summarize(sd_var1 = sd(var1, na. rm = TRUE ), sd_var2 = sd(var2, na. rm = TRUE ))
In deze tutorial wordt uitgelegd hoe u elke methode in de praktijk kunt gebruiken met het volgende dataframe in R:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(12, 15, 18, 22, 14, 17, 29, 35),
assists=c(4, 4, 3, 6, 7, 8, 3, 10))
#view data frame
df
team points assists
1 to 12 4
2 to 15 4
3 To 18 3
4 to 22 6
5 B 14 7
6 B 17 8
7 B 29 3
8 B 35 10
Voorbeeld 1: Bereken de standaardafwijking van een variabele
De volgende code laat zien hoe u de standaardafwijking van de puntenvariabele berekent:
library (dplyr) #calculate standard deviation of points variable df %>% summarise(sd_points = sd(points, na. rm = TRUE )) sd_points 1 7.995534
Uit het resultaat kunnen we zien dat de standaardafwijking van de waarden van de puntenvariabele 7,995534 is.
Voorbeeld 2: Bereken de standaardafwijking van verschillende variabelen
De volgende code laat zien hoe u de standaardafwijking van punten en hulpvariabelen kunt berekenen:
library (dplyr) #calculate standard deviation of points and assists variables df %>% summarise(sd_points = sd(points, na. rm = TRUE ), sd_assists = sd(assists, na. rm = TRUE )) sd_points sd_assists 1 7.995534 2.559994
De uitvoer toont de standaardafwijking voor de punten en hulpvariabelen .
Voorbeeld 3: bereken de standaardafwijking van verschillende variabelen, gegroepeerd door een andere variabele
De volgende code laat zien hoe u de standaardafwijking van punten en hulpvariabelen kunt berekenen:
library (dplyr) #calculate standard deviation of points and assists variables df %>% group_by(team) %>% summarise(sd_points = sd(points, na. rm = TRUE ), sd_assists = sd(assists, na. rm = TRUE )) # A tibble: 2 x 3 team sd_points sd_assists 1 A 4.27 1.26 2B 9.91 2.94
Het resultaat toont de standaardafwijking voor de punten en hulpvariabelen voor Team A en Team B.
Opmerking : u kunt een lijst met meerdere variabelen opnemen in de functie group_by() als u op meerdere variabelen wilt groeperen.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:
Hoe unieke waarden te filteren met dplyr
Hoe u op meerdere voorwaarden kunt filteren met behulp van dplyr
Hoe het aantal exemplaren in kolommen in R te tellen