R에서 열의 표준 편차를 계산하는 방법


다음 기본 구문을 사용하여 R 열의 표준 편차를 계산할 수 있습니다.

 #calculate standard deviation of one column
sd(df$col1)

#calculate standard deviation of all columns
sapply(df, sd)

#calculate standard deviation of specific columns
sapply(df[c(' col1 ', ' col2 ', ' col5 ')], sd)

다음 예에서는 다음 데이터 프레임에서 실제로 이 구문을 사용하는 방법을 보여줍니다.

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#view data frame
df

  team points assists rebounds
1 A 99 33 30
2 B 91 28 28
3 C 86 31 24
4 D 88 39 24
5 E 95 34 28

예시 1: 열의 표준편차

다음 코드는 데이터 프레임에 있는 열의 표준 편차를 계산하는 방법을 보여줍니다.

 #calculate standard deviation of 'points' column
sd(df$points)

[1] 5.263079

“포인트” 열에 있는 값의 표준 편차는 5.263079 입니다.

예시 2: 모든 열의 표준편차

다음 코드는 데이터 프레임에 있는 각 열의 표준 편차를 계산하는 방법을 보여줍니다.

 #calculate standard deviation of all columns in data frame
sapply(df, sd)

    team points assists rebounds 
      NA 5.263079 4.062019 2.683282 
Warning message:
In var(if (is.vector(x) || is.factor(x)) x else as.double(x), na.rm = na.rm):
  NAs introduced by coercion

“팀” 열은 문자 변수이므로 R은 NA를 반환하고 경고를 표시합니다.

그러나 다른 세 숫자 열의 표준 편차는 성공적으로 계산됩니다.

예 3: 특정 열의 표준 편차

다음 코드는 데이터 프레임에서 특정 열의 표준 편차를 계산하는 방법을 보여줍니다.

 #calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(' points ', ' rebounds ')], sd)

  rebound points 
5.263079 2.683282

열 인덱스 값을 사용하여 열을 선택할 수도 있습니다.

 #calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(2, 4)], sd)

  rebound points 
5.263079 2.683282

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 기능을 수행하는 방법을 설명합니다.

R에서 행의 표준 편차를 계산하는 방법
R에서 여러 열의 평균을 계산하는 방법
R의 여러 열에서 최대값을 찾는 방법
R에서 특정 열을 선택하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다