R에서 열의 표준 편차를 계산하는 방법

에 의해 벤자민 앤더슨 7월 23, 2023 가이드 댓글 0개

다음 기본 구문을 사용하여 R 열의 표준 편차를 계산할 수 있습니다.

 #calculate standard deviation of one column
sd(df$col1)

#calculate standard deviation of all columns
sapply(df, sd)

#calculate standard deviation of specific columns
sapply(df[c(' col1 ', ' col2 ', ' col5 ')], sd)

다음 예에서는 다음 데이터 프레임에서 실제로 이 구문을 사용하는 방법을 보여줍니다.

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#view data frame
df

  team points assists rebounds
1 A 99 33 30
2 B 91 28 28
3 C 86 31 24
4 D 88 39 24
5 E 95 34 28

예시 1: 열의 표준편차

다음 코드는 데이터 프레임에 있는 열의 표준 편차를 계산하는 방법을 보여줍니다.

 #calculate standard deviation of 'points' column
sd(df$points)

[1] 5.263079

“포인트” 열에 있는 값의 표준 편차는 5.263079 입니다.

예시 2: 모든 열의 표준편차

다음 코드는 데이터 프레임에 있는 각 열의 표준 편차를 계산하는 방법을 보여줍니다.

 #calculate standard deviation of all columns in data frame
sapply(df, sd)

    team points assists rebounds 
      NA 5.263079 4.062019 2.683282 
Warning message:
In var(if (is.vector(x) || is.factor(x)) x else as.double(x), na.rm = na.rm):
  NAs introduced by coercion

“팀” 열은 문자 변수이므로 R은 NA를 반환하고 경고를 표시합니다.

그러나 다른 세 숫자 열의 표준 편차는 성공적으로 계산됩니다.

예 3: 특정 열의 표준 편차

다음 코드는 데이터 프레임에서 특정 열의 표준 편차를 계산하는 방법을 보여줍니다.

 #calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(' points ', ' rebounds ')], sd)

  rebound points 
5.263079 2.683282

열 인덱스 값을 사용하여 열을 선택할 수도 있습니다.

 #calculate standard deviation of 'points' and 'rebounds' columns
sapply(df[c(2, 4)], sd)

  rebound points 
5.263079 2.683282

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 기능을 수행하는 방법을 설명합니다.

R에서 행의 표준 편차를 계산하는 방법
R에서 여러 열의 평균을 계산하는 방법
R의 여러 열에서 최대값을 찾는 방법
R에서 특정 열을 선택하는 방법

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기