Як використовувати функцію colmeans() у r


Функцію colMeans() у R можна використовувати для обчислення середнього значення кількох стовпців матриці або кадру даних у R.

Ця функція використовує такий базовий синтаксис:

 #calculate column means of every column
colMeans(df)

#calculate column means and exclude NA values
colMeans(df, na. rm = T )

#calculate column means of specific columns
colMeans(df[c(' col1 ', ' col3 ', ' col4 ')])

Наступні приклади показують, як використовувати цей синтаксис на практиці.

Приклад 1: обчисліть середнє значення кожного стовпця

Наступний код показує, як обчислити середнє значення кожного стовпця у кадрі даних:

 #create data frame
df <- data. frame (points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means
colMeans(df)

  points assists rebounds blocks 
    91.8 33.0 26.8 3.6

Приклад 2 : обчисліть середнє значення кожного стовпця та виключіть NA

Наступний код показує, як обчислити середнє значення кожного стовпця та виключити значення NA:

 #create data frame with some NA values
df <- data. frame (points=c(99, 91, 86, 88, 95),
                 assists=c(33, NA, 31, 39, 34),
                 rebounds=c(30, 28, NA, NA, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means
colMeans(df, na. rm = T )

  points assists rebounds blocks 
91.80000 34.25000 28.66667 3.60000

Приклад 3: обчисліть середнє значення певних стовпців

Наступний код показує, як обчислити середні значення певних стовпців у кадрі даних:

 #create data frame
df <- data. frame (points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means for 'points' and 'blocks' columns
colMeans(df[c(' points ', ' blocks ')])

point blocks 
  91.8 3.6

Зверніть увагу, що ми також можемо використовувати значення індексу для усереднення певних стовпців:

 #create data frame
df <- data. frame (points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means for columns in position 1 and 4
colMeans(df[c(1, 4)])

point blocks 
  91.8 3.6

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші поширені функції в R:

Як обчислити стандартне відхилення стовпців у R
Як обчислити середнє значення на групу в R
Як обчислити суму за групою в R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *