Come utilizzare la funzione colmeans() in r


La funzione colMeans() in R può essere utilizzata per calcolare la media di più colonne di una matrice o frame di dati in R.

Questa funzione utilizza la seguente sintassi di base:

 #calculate column means of every column
colMeans(df)

#calculate column means and exclude NA values
colMeans(df, na. rm = T )

#calculate column means of specific columns
colMeans(df[c(' col1 ', ' col3 ', ' col4 ')])

Gli esempi seguenti mostrano come utilizzare questa sintassi nella pratica.

Esempio 1: calcolare la media di ciascuna colonna

Il codice seguente mostra come calcolare la media di ciascuna colonna in un frame di dati:

 #create data frame
df <- data. frame (points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means
colMeans(df)

  points assists rebounds blocks 
    91.8 33.0 26.8 3.6

Esempio 2 : calcolare la media di ciascuna colonna ed escludere le NA

Il codice seguente mostra come calcolare la media di ciascuna colonna ed escludere i valori NA:

 #create data frame with some NA values
df <- data. frame (points=c(99, 91, 86, 88, 95),
                 assists=c(33, NA, 31, 39, 34),
                 rebounds=c(30, 28, NA, NA, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means
colMeans(df, na. rm = T )

  points assists rebounds blocks 
91.80000 34.25000 28.66667 3.60000

Esempio 3: calcolare la media di colonne specifiche

Il codice seguente mostra come calcolare i valori medi di colonne specifiche nel frame di dati:

 #create data frame
df <- data. frame (points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means for 'points' and 'blocks' columns
colMeans(df[c(' points ', ' blocks ')])

point blocks 
  91.8 3.6

Tieni presente che possiamo anche utilizzare i valori dell’indice per calcolare la media di colonne specifiche:

 #create data frame
df <- data. frame (points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means for columns in position 1 and 4
colMeans(df[c(1, 4)])

point blocks 
  91.8 3.6

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre funzioni comuni in R:

Come calcolare la deviazione standard delle colonne in R
Come calcolare la media per gruppo in R
Come calcolare la somma per gruppo in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *