R에서 열의 표준 편차를 계산하는 방법
다음 기본 구문을 사용하여 R 열의 표준 편차를 계산할 수 있습니다.
#calculate standard deviation of one column sd(df$col1) #calculate standard deviation of all columns sapply(df, sd) #calculate standard deviation of specific columns sapply(df[c(' col1 ', ' col2 ', ' col5 ')], sd)
다음 예에서는 다음 데이터 프레임에서 실제로 이 구문을 사용하는 방법을 보여줍니다.
#create data frame df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'), points=c(99, 91, 86, 88, 95), assists=c(33, 28, 31, 39, 34), rebounds=c(30, 28, 24, 24, 28)) #view data frame df team points assists rebounds 1 A 99 33 30 2 B 91 28 28 3 C 86 31 24 4 D 88 39 24 5 E 95 34 28
예시 1: 열의 표준편차
다음 코드는 데이터 프레임에 있는 열의 표준 편차를 계산하는 방법을 보여줍니다.
#calculate standard deviation of 'points' column
sd(df$points)
[1] 5.263079
“포인트” 열에 있는 값의 표준 편차는 5.263079 입니다.
예시 2: 모든 열의 표준편차
다음 코드는 데이터 프레임에 있는 각 열의 표준 편차를 계산하는 방법을 보여줍니다.
#calculate standard deviation of all columns in data frame
sapply(df, sd)
team points assists rebounds
NA 5.263079 4.062019 2.683282
Warning message:
In var(if (is.vector(x) || is.factor(x)) x else as.double(x), na.rm = na.rm):
NAs introduced by coercion
“팀” 열은 문자 변수이므로 R은 NA를 반환하고 경고를 표시합니다.
그러나 다른 세 숫자 열의 표준 편차는 성공적으로 계산됩니다.
예 3: 특정 열의 표준 편차
다음 코드는 데이터 프레임에서 특정 열의 표준 편차를 계산하는 방법을 보여줍니다.
#calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(' points ', ' rebounds ')], sd)
rebound points
5.263079 2.683282
열 인덱스 값을 사용하여 열을 선택할 수도 있습니다.
#calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(2, 4)], sd)
rebound points
5.263079 2.683282
추가 리소스
다음 튜토리얼에서는 R에서 다른 일반적인 기능을 수행하는 방법을 설명합니다.
R에서 행의 표준 편차를 계산하는 방법
R에서 여러 열의 평균을 계산하는 방법
R의 여러 열에서 최대값을 찾는 방법
R에서 특정 열을 선택하는 방법