Come calcolare la media sulle colonne in r (con esempi)


Spesso potresti voler calcolare la media dei valori su più colonne in R. Fortunatamente, questo è facile da fare utilizzando la funzione rowMeans() .

Questo tutorial mostra diversi esempi di utilizzo pratico di questa funzione.

Esempio 1: trova la media su tutte le colonne

Il codice seguente mostra come calcolare il valore medio di ciascuna riga su tutte le colonne in un frame di dati:

 #create data frame
data <- data.frame(var1 = c(0, NA, 2, 2, 5),
                   var2 = c(5, 5, 7, 8, 9),
                   var3 = c(2, 7, 9, 9, 7))

#view data frame
data

  var1 var2 var3
1 0 5 2
2 NA 5 7
3 2 7 9
4 2 8 9
5 5 9 7

#find average value in each row
rowMeans(data, na.rm= TRUE )

[1] 2.333333 6.000000 6.000000 6.333333 7.000000

Il modo di interpretare il risultato è il seguente:

  • Il valore medio nella prima riga è 2.333 .
  • Il valore medio nella seconda riga è 6 .
  • Il valore medio nella terza riga è 6 .
  • Il valore medio nella quarta riga è 6.333 .
  • Il valore medio nella quinta riga è 7 .

Puoi anche assegnare queste medie di riga a una nuova variabile nel frame dati:

 #assign row averages to new variable named row_mean
data$row_mean <- rowMeans(data, na.rm= TRUE )

#view data frame
data

  var1 var2 var3 row_mean
1 0 5 2 2.333333
2 NA 5 7 6.000000
3 2 7 9 6.000000
4 2 8 9 6.333333
5 5 9 7 7.000000

Esempio 2: trova la media su colonne specifiche

È anche possibile trovare la media solo su colonne specifiche di un frame di dati. Ad esempio, il codice seguente mostra come calcolare le medie delle righe solo per le prime due colonne:

 #find row averages across first two columns
data$new <- rowMeans(data[, c(1,2)], na.rm= TRUE )

#view data frame
data

  var1 var2 var3 new
1 0 5 2 2.5
2 NA 5 7 5.0
3 2 7 9 4.5
4 2 8 9 5.0
5 5 9 7 7.0

Possiamo vedere questo:

  • Il valore medio della prima riga delle prime due colonne è 2,5 .
  • Il valore medio della seconda riga delle prime due colonne è 5 .

E così via.

Puoi utilizzare una sintassi simile per trovare le medie delle righe per qualsiasi insieme di colonne. Ad esempio, il codice seguente mostra come calcolare le medie delle righe solo per la prima e la terza colonna:

 #find row averages across first and third columns
data$new <- rowMeans(data[, c(1,3)], na.rm= TRUE )

#view data frame
data

  var1 var2 var3 new
1 0 5 2 1.0
2 NA 5 7 7.0
3 2 7 9 5.5
4 2 8 9 5.5
5 5 9 7 6.0

Possiamo vedere questo:

  • Il valore medio della prima riga della prima e della terza colonna è 1 .
  • Il valore medio nella seconda riga della prima e della terza colonna è 7 .

E così via.

Puoi trovare altri tutorial su R qui .

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *