Dplyr을 사용하여 표준 편차를 계산하는 방법(예제 포함)
다음 방법을 사용하여 dplyr 의 데이터 프레임 값의 표준 편차를 계산할 수 있습니다.
방법 1: 변수의 표준편차 계산
library (dplyr) df %>% summarise(sd_var1 = sd(var1, na. rm = TRUE ))
방법 2: 여러 변수의 표준편차 계산
library (dplyr) df %>% summarize(sd_var1 = sd(var1, na. rm = TRUE ), sd_var2 = sd(var2, na. rm = TRUE ))
방법 3: 다른 변수로 그룹화된 여러 변수의 표준 편차를 계산합니다.
library (dplyr) df %>% group_by(var3) %>% summarize(sd_var1 = sd(var1, na. rm = TRUE ), sd_var2 = sd(var2, na. rm = TRUE ))
이 튜토리얼에서는 R의 다음 데이터 프레임을 사용하여 실제로 각 방법을 사용하는 방법을 설명합니다.
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(12, 15, 18, 22, 14, 17, 29, 35),
assists=c(4, 4, 3, 6, 7, 8, 3, 10))
#view data frame
df
team points assists
1 to 12 4
2 to 15 4
3 To 18 3
4 to 22 6
5 B 14 7
6 B 17 8
7 B 29 3
8 B 35 10
예시 1: 변수의 표준편차 계산
다음 코드는 포인트 변수의 표준 편차를 계산하는 방법을 보여줍니다.
library (dplyr) #calculate standard deviation of points variable df %>% summarise(sd_points = sd(points, na. rm = TRUE )) sd_points 1 7.995534
그 결과, points 변수 값의 표준편차는 7.995534 임을 알 수 있다.
예시 2: 여러 변수의 표준편차 계산
다음 코드는 점 과 도우미 변수의 표준 편차를 계산하는 방법을 보여줍니다.
library (dplyr) #calculate standard deviation of points and assists variables df %>% summarise(sd_points = sd(points, na. rm = TRUE ), sd_assists = sd(assists, na. rm = TRUE )) sd_points sd_assists 1 7.995534 2.559994
출력에는 포인트 및 보조 변수의 표준 편차가 표시됩니다.
예 3: 다른 변수로 그룹화된 여러 변수의 표준 편차 계산
다음 코드는 점 과 도우미 변수의 표준 편차를 계산하는 방법을 보여줍니다.
library (dplyr) #calculate standard deviation of points and assists variables df %>% group_by(team) %>% summarise(sd_points = sd(points, na. rm = TRUE ), sd_assists = sd(assists, na. rm = TRUE )) # A tibble: 2 x 3 team sd_points sd_assists 1 A 4.27 1.26 2B 9.91 2.94
결과에는 A팀과 B팀의 포인트 및 보조 변수에 대한 표준 편차가 표시됩니다.
참고 : 여러 변수를 기준으로 그룹화하려는 경우 group_by() 함수에 여러 변수 목록을 포함할 수 있습니다.
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
dplyr을 사용하여 고유 값을 필터링하는 방법
dplyr을 사용하여 여러 조건으로 필터링하는 방법
R의 열에서 발생 횟수를 계산하는 방법