R에서 여러 열의 평균을 계산하는 방법


R에서 여러 열의 평균을 계산해야 하는 경우가 종종 있습니다. 다행히 colMeans() 함수를 사용하면 쉽게 이 작업을 수행할 수 있습니다.

 colMeans(df)

다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.

colMeans()를 사용하여 여러 열의 평균 찾기

다음 코드는 colMeans() 함수를 사용하여 데이터 프레임에 있는 각 열의 평균을 찾는 방법을 보여줍니다.

 #create data frame
df <- data.frame(var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#find mean of each column
colMeans(df)

var1 var2 var3 var4 
 3.2 5.4 5.2 4.2 

또한 다음 항목에 대한 평균을 찾을 열을 지정할 수도 있습니다.

 #find the mean of columns 2 and 3
colMeans(df[, c(2, 3)])

var2 var3 
 5.4 5.2 

#find the mean of the first three columns
colMeans(df[, 1:3])

var1 var2 var3 
 3.2 5.4 5.2

숫자가 아닌 열이 있는 경우 sapply()를 사용하여 숫자 열의 평균만 찾도록 지정할 수 있습니다.

 #create data frame
df <- data.frame(var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9),
                 var5=c('a', 'a', 'b', 'b', 'c'))

#find mean of only numeric columns
colMeans(df[ sapply (df, is.numeric)])

var1 var2 var3 var4 
 3.2 5.4 5.2 4.2

그리고 열에 누락된 값이 있는 경우 na.rm=TRUE 인수를 사용하여 평균을 계산할 때 누락된 값을 무시할 수 있습니다.

 #create data frame with some missing values
df <- data.frame(var1=c(1, 3, NA, NA, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, NA))

#find mean of each column and ignore missing values
colMeans(df, na.rm= TRUE )

var1 var2 var3 var4 
 3.0 5.4 5.2 3.0

추가 리소스

R에서 열 이름을 반복하는 방법
R의 특정 열을 합산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다