Como calcular a média das colunas em r (com exemplos)


Freqüentemente, você pode querer calcular a média dos valores em várias colunas em R. Felizmente, isso é fácil de fazer usando a função rowMeans() .

Este tutorial mostra vários exemplos de uso prático desta função.

Exemplo 1: Encontre a média em todas as colunas

O código a seguir mostra como calcular o valor médio de cada linha em todas as colunas de um quadro de dados:

 #create data frame
data <- data.frame(var1 = c(0, NA, 2, 2, 5),
                   var2 = c(5, 5, 7, 8, 9),
                   var3 = c(2, 7, 9, 9, 7))

#view data frame
data

  var1 var2 var3
1 0 5 2
2 NA 5 7
3 2 7 9
4 2 8 9
5 5 9 7

#find average value in each row
rowMeans(data, na.rm= TRUE )

[1] 2.333333 6.000000 6.000000 6.333333 7.000000

A forma de interpretar o resultado é a seguinte:

  • O valor médio na primeira linha é 2,333 .
  • O valor médio na segunda linha é 6 .
  • O valor médio na terceira linha é 6 .
  • O valor médio na quarta linha é 6,333 .
  • O valor médio na quinta linha é 7 .

Você também pode atribuir essas médias de linha a uma nova variável no quadro de dados:

 #assign row averages to new variable named row_mean
data$row_mean <- rowMeans(data, na.rm= TRUE )

#view data frame
data

  var1 var2 var3 row_mean
1 0 5 2 2.333333
2 NA 5 7 6.000000
3 2 7 9 6.000000
4 2 8 9 6.333333
5 5 9 7 7.000000

Exemplo 2: Encontre a média em colunas específicas

Também é possível encontrar a média apenas em colunas específicas de um quadro de dados. Por exemplo, o código a seguir mostra como calcular médias de linhas apenas para as duas primeiras colunas:

 #find row averages across first two columns
data$new <- rowMeans(data[, c(1,2)], na.rm= TRUE )

#view data frame
data

  var1 var2 var3 new
1 0 5 2 2.5
2 NA 5 7 5.0
3 2 7 9 4.5
4 2 8 9 5.0
5 5 9 7 7.0

Podemos ver isso:

  • O valor médio da primeira linha das duas primeiras colunas é 2,5 .
  • O valor médio da segunda linha das duas primeiras colunas é 5 .

E assim por diante.

Você pode usar sintaxe semelhante para encontrar médias de linhas para qualquer conjunto de colunas. Por exemplo, o código a seguir mostra como calcular médias de linhas somente para a primeira e terceira colunas:

 #find row averages across first and third columns
data$new <- rowMeans(data[, c(1,3)], na.rm= TRUE )

#view data frame
data

  var1 var2 var3 new
1 0 5 2 1.0
2 NA 5 7 7.0
3 2 7 9 5.5
4 2 8 9 5.5
5 5 9 7 6.0

Podemos ver isso:

  • O valor médio da primeira linha da primeira e terceira colunas é 1 .
  • O valor médio na segunda linha da primeira e terceira colunas é 7 .

E assim por diante.

Você pode encontrar mais tutoriais de R aqui .

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *