Como calcular a média de uma coluna em r (com exemplos)


Você pode usar qualquer um dos seguintes métodos para calcular a média de uma coluna em R:

 #calculate mean using column name
mean(df$my_column)

#calculate mean using column name (ignore missing values)
mean(df$my_column, na. rm = TRUE )

#calculate mean using column position
mean(df[, 1])

#calculation mean of all numeric columns
colMeans(df[sapply(df, is. numeric )])

Os exemplos a seguir mostram como usar cada método com o seguinte quadro de dados em R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 points=c(99, 90, 93, 86, 88, 82),
                 assists=c(33, 28, 31, 39, NA, 30))

#view data frame
df

  team points assists
1 A 99 33
2 A 90 28
3 A 93 31
4 B 86 39
5 B 88 NA
6 B 82 30

Exemplo 1: Calcule a média usando o nome da coluna

O código a seguir mostra como calcular a média da coluna “pontos” usando o nome da coluna:

 #calculate mean of 'points' column
mean(df$points)

[1] 89.66667

O valor médio na coluna “pontos” é 89,66667 .

Exemplo 2: Calcular a média usando o nome da coluna (ignorar valores ausentes)

Se tentarmos calcular a média de uma coluna contendo valores faltantes, obteremos NA :

 #attempt to calculate mean of 'assists' column
mean(df$assists)

[1] NA

Precisamos usar na.rm=TRUE para ignorar os valores ausentes ao calcular a média da coluna:

 #calculate mean of 'assists' column and ignore missing values
mean(df$assists, na. rm = TRUE )

[1] 32.2

O valor médio na coluna “assistências” é 32,2 .

Exemplo 3: Calcule a média usando a posição da coluna

O código a seguir mostra como calcular a média da coluna na posição 2 do índice:

 #calculate mean of column in index position 2
mean(df[, 2])

[1] 89.66667

O valor médio da coluna na posição 2 do índice (a coluna “pontos”) é 89.66667 .

Exemplo 4: Calcule a média de todas as colunas numéricas

O código a seguir mostra como calcular a média de todas as colunas numéricas no quadro de dados:

 #calculate mean of all numeric columns
colMeans(df[sapply(df, is. numeric )], na. rm = TRUE )

  assist points 
89.66667 32.20000

A saída exibe o valor médio de cada coluna numérica no quadro de dados.

Recursos adicionais

Os tutoriais a seguir explicam como calcular outros valores médios em R:

Como calcular uma média aparada em R
Como calcular a média geométrica em R
Como calcular uma média ponderada em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *