Як обчислити середнє значення кількох стовпців у r
Часто вам може знадобитися обчислити середнє значення кількох стовпців у R. На щастя, це можна легко зробити за допомогою функції colMeans() .
colMeans(df)
Наступні приклади показують, як використовувати цю функцію на практиці.
Використання colMeans() для знаходження середнього значення кількох стовпців
У наступному коді показано, як використовувати функцію colMeans() , щоб знайти середнє значення кожного стовпця у кадрі даних:
#create data frame df <- data.frame(var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9)) #find mean of each column colMeans(df) var1 var2 var3 var4 3.2 5.4 5.2 4.2
Ми також можемо вказати, для яких стовпців шукати середнє значення:
#find the mean of columns 2 and 3 colMeans(df[, c(2, 3)]) var2 var3 5.4 5.2 #find the mean of the first three columns colMeans(df[, 1:3]) var1 var2 var3 3.2 5.4 5.2
Якщо є стовпці, які не є числовими, ви можете використовувати sapply() , щоб вказати, що ви хочете знайти лише середнє значення числових стовпців:
#create data frame df <- data.frame(var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9), var5=c('a', 'a', 'b', 'b', 'c')) #find mean of only numeric columns colMeans(df[ sapply (df, is.numeric)]) var1 var2 var3 var4 3.2 5.4 5.2 4.2
І якщо в будь-якому стовпці є відсутні значення, ви можете використовувати аргумент na.rm=TRUE , щоб ігнорувати відсутні значення під час обчислення середніх:
#create data frame with some missing values df <- data.frame(var1=c(1, 3, NA, NA, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, NA)) #find mean of each column and ignore missing values colMeans(df, na.rm= TRUE ) var1 var2 var3 var4 3.0 5.4 5.2 3.0
Додаткові ресурси
Як перебирати імена стовпців у R
Як підсумувати певні стовпці в R