Как вычислить среднее значение столбца в r (с примерами)


Вы можете использовать любой из следующих методов для вычисления среднего значения столбца в R:

 #calculate mean using column name
mean(df$my_column)

#calculate mean using column name (ignore missing values)
mean(df$my_column, na. rm = TRUE )

#calculate mean using column position
mean(df[, 1])

#calculation mean of all numeric columns
colMeans(df[sapply(df, is. numeric )])

В следующих примерах показано, как использовать каждый метод со следующим фреймом данных в R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 points=c(99, 90, 93, 86, 88, 82),
                 assists=c(33, 28, 31, 39, NA, 30))

#view data frame
df

  team points assists
1 A 99 33
2 A 90 28
3 A 93 31
4 B 86 39
5 B 88 NA
6 B 82 30

Пример 1. Вычисление среднего значения по имени столбца

Следующий код показывает, как вычислить среднее значение столбца «точек», используя имя столбца:

 #calculate mean of 'points' column
mean(df$points)

[1] 89.66667

Среднее значение в графе «баллы» — 89,66667 .

Пример 2. Вычисление среднего значения с использованием имени столбца (игнорировать пропущенные значения)

Если мы попытаемся вычислить среднее значение столбца, содержащего пропущенные значения, мы получим NA :

 #attempt to calculate mean of 'assists' column
mean(df$assists)

[1] NA

Нам нужно использовать na.rm=TRUE , чтобы игнорировать пропущенные значения при вычислении среднего значения по столбцу:

 #calculate mean of 'assists' column and ignore missing values
mean(df$assists, na. rm = TRUE )

[1] 32.2

Среднее значение в графе «передачи» — 32,2 .

Пример 3. Вычисление среднего значения по положению столбца

Следующий код показывает, как вычислить среднее значение столбца в позиции индекса 2:

 #calculate mean of column in index position 2
mean(df[, 2])

[1] 89.66667

Среднее значение столбца в позиции индекса 2 (столбец «пункты») составляет 89,66667 .

Пример 4. Вычисление среднего значения всех числовых столбцов

Следующий код показывает, как вычислить среднее значение всех числовых столбцов во фрейме данных:

 #calculate mean of all numeric columns
colMeans(df[sapply(df, is. numeric )], na. rm = TRUE )

  assist points 
89.66667 32.20000

На выходе отображается среднее значение каждого числового столбца во фрейме данных.

Дополнительные ресурсы

В следующих уроках объясняется, как рассчитать другие средние значения в R:

Как вычислить усеченное среднее значение в R
Как вычислить среднее геометрическое в R
Как рассчитать средневзвешенное значение в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *