Как усреднить столбцы в r (с примерами)


Часто вам может потребоваться усреднить значения по нескольким столбцам в R. К счастью, это легко сделать с помощью функции rowMeans() .

В этом уроке показано несколько примеров практического использования этой функции.

Пример 1. Найдите среднее значение по всем столбцам.

Следующий код показывает, как вычислить среднее значение каждой строки по всем столбцам во фрейме данных:

 #create data frame
data <- data.frame(var1 = c(0, NA, 2, 2, 5),
                   var2 = c(5, 5, 7, 8, 9),
                   var3 = c(2, 7, 9, 9, 7))

#view data frame
data

  var1 var2 var3
1 0 5 2
2 NA 5 7
3 2 7 9
4 2 8 9
5 5 9 7

#find average value in each row
rowMeans(data, na.rm= TRUE )

[1] 2.333333 6.000000 6.000000 6.333333 7.000000

Интерпретация результата следующая:

  • Среднее значение в первой строке — 2,333 .
  • Среднее значение во второй строке — 6 .
  • Среднее значение в третьей строке — 6 .
  • Среднее значение в четвертой строке — 6,333 .
  • Среднее значение в пятой строке — 7 .

Вы также можете присвоить эти средние значения по строкам новой переменной во фрейме данных:

 #assign row averages to new variable named row_mean
data$row_mean <- rowMeans(data, na.rm= TRUE )

#view data frame
data

  var1 var2 var3 row_mean
1 0 5 2 2.333333
2 NA 5 7 6.000000
3 2 7 9 6.000000
4 2 8 9 6.333333
5 5 9 7 7.000000

Пример 2. Найдите среднее значение по определенным столбцам.

Также возможно найти среднее значение только для определенных столбцов фрейма данных. Например, следующий код показывает, как вычислить средние значения по строкам только для первых двух столбцов:

 #find row averages across first two columns
data$new <- rowMeans(data[, c(1,2)], na.rm= TRUE )

#view data frame
data

  var1 var2 var3 new
1 0 5 2 2.5
2 NA 5 7 5.0
3 2 7 9 4.5
4 2 8 9 5.0
5 5 9 7 7.0

Мы можем видеть это:

  • Среднее значение первой строки первых двух столбцов равно 2,5 .
  • Среднее значение второй строки первых двух столбцов равно 5 .

И так далее.

Вы можете использовать аналогичный синтаксис, чтобы найти средние значения по строкам для любого набора столбцов. Например, следующий код показывает, как вычислить средние значения по строкам только для первого и третьего столбцов:

 #find row averages across first and third columns
data$new <- rowMeans(data[, c(1,3)], na.rm= TRUE )

#view data frame
data

  var1 var2 var3 new
1 0 5 2 1.0
2 NA 5 7 7.0
3 2 7 9 5.5
4 2 8 9 5.5
5 5 9 7 6.0

Мы можем видеть это:

  • Среднее значение первой строки первого и третьего столбцов равно 1 .
  • Среднее значение во второй строке первого и третьего столбца равно 7 .

И так далее.

Дополнительные руководства по R можно найти здесь .

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *