Як усереднити за стовпцями в r (з прикладами)


Часто вам може знадобитися усереднити значення для кількох стовпців у R. На щастя, це легко зробити за допомогою функції rowMeans() .

Цей підручник демонструє кілька прикладів практичного використання цієї функції.

Приклад 1: Знайдіть середнє значення за всіма стовпцями

Наступний код показує, як обчислити середнє значення кожного рядка в усіх стовпцях у фреймі даних:

 #create data frame
data <- data.frame(var1 = c(0, NA, 2, 2, 5),
                   var2 = c(5, 5, 7, 8, 9),
                   var3 = c(2, 7, 9, 9, 7))

#view data frame
data

  var1 var2 var3
1 0 5 2
2 NA 5 7
3 2 7 9
4 2 8 9
5 5 9 7

#find average value in each row
rowMeans(data, na.rm= TRUE )

[1] 2.333333 6.000000 6.000000 6.333333 7.000000

Спосіб інтерпретації результату такий:

  • Середнє значення в першому рядку – 2,333 .
  • Середнє значення у другому рядку 6 .
  • Середнє значення в третьому рядку 6 .
  • Середнє значення в четвертому рядку становить 6,333 .
  • Середнє значення в п’ятому рядку дорівнює 7 .

Ви також можете призначити ці середні рядки новій змінній у кадрі даних:

 #assign row averages to new variable named row_mean
data$row_mean <- rowMeans(data, na.rm= TRUE )

#view data frame
data

  var1 var2 var3 row_mean
1 0 5 2 2.333333
2 NA 5 7 6.000000
3 2 7 9 6.000000
4 2 8 9 6.333333
5 5 9 7 7.000000

Приклад 2: Знайдіть середнє значення за певними стовпцями

Також можна знайти середнє значення лише для певних стовпців кадру даних. Наприклад, наведений нижче код показує, як обчислити середні значення лише для перших двох стовпців:

 #find row averages across first two columns
data$new <- rowMeans(data[, c(1,2)], na.rm= TRUE )

#view data frame
data

  var1 var2 var3 new
1 0 5 2 2.5
2 NA 5 7 5.0
3 2 7 9 4.5
4 2 8 9 5.0
5 5 9 7 7.0

Ми бачимо це:

  • Середнє значення першого рядка перших двох стовпців дорівнює 2,5 .
  • Середнє значення другого рядка перших двох стовпців дорівнює 5 .

І так далі.

Ви можете використовувати аналогічний синтаксис, щоб знайти середні значення рядків для будь-якого набору стовпців. Наприклад, наведений нижче код показує, як обчислити середні значення лише для першого та третього стовпців:

 #find row averages across first and third columns
data$new <- rowMeans(data[, c(1,3)], na.rm= TRUE )

#view data frame
data

  var1 var2 var3 new
1 0 5 2 1.0
2 NA 5 7 7.0
3 2 7 9 5.5
4 2 8 9 5.5
5 5 9 7 6.0

Ми бачимо це:

  • Середнє значення першого рядка першого і третього стовпців дорівнює 1 .
  • Середнє значення в другому рядку першого і третього стовпців дорівнює 7 .

І так далі.

Ви можете знайти більше підручників з R тут .

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *