Come calcolare la media di una colonna in r (con esempi)


È possibile utilizzare uno dei seguenti metodi per calcolare la media di una colonna in R:

 #calculate mean using column name
mean(df$my_column)

#calculate mean using column name (ignore missing values)
mean(df$my_column, na. rm = TRUE )

#calculate mean using column position
mean(df[, 1])

#calculation mean of all numeric columns
colMeans(df[sapply(df, is. numeric )])

Gli esempi seguenti mostrano come utilizzare ciascun metodo con il seguente frame di dati in R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 points=c(99, 90, 93, 86, 88, 82),
                 assists=c(33, 28, 31, 39, NA, 30))

#view data frame
df

  team points assists
1 A 99 33
2 A 90 28
3 A 93 31
4 B 86 39
5 B 88 NA
6 B 82 30

Esempio 1: calcola la media utilizzando il nome della colonna

Il codice seguente mostra come calcolare la media della colonna “punti” utilizzando il nome della colonna:

 #calculate mean of 'points' column
mean(df$points)

[1] 89.66667

Il valore medio nella colonna “punti” è 89.66667 .

Esempio 2: calcolare la media utilizzando il nome della colonna (ignorare i valori mancanti)

Se proviamo a calcolare la media di una colonna contenente valori mancanti, otterremo NA :

 #attempt to calculate mean of 'assists' column
mean(df$assists)

[1] NA

Dobbiamo utilizzare na.rm=TRUE per ignorare i valori mancanti durante il calcolo della media della colonna:

 #calculate mean of 'assists' column and ignore missing values
mean(df$assists, na. rm = TRUE )

[1] 32.2

Il valore medio nella colonna “assist” è 32,2 .

Esempio 3: calcolare la media utilizzando la posizione della colonna

Il codice seguente mostra come calcolare la media della colonna nella posizione dell’indice 2:

 #calculate mean of column in index position 2
mean(df[, 2])

[1] 89.66667

Il valore medio della colonna nella posizione dell’indice 2 (la colonna “punti”) è 89.66667 .

Esempio 4: calcola la media di tutte le colonne numeriche

Il codice seguente mostra come calcolare la media di tutte le colonne numeriche nel frame di dati:

 #calculate mean of all numeric columns
colMeans(df[sapply(df, is. numeric )], na. rm = TRUE )

  assist points 
89.66667 32.20000

L’output visualizza il valore medio di ciascuna colonna numerica nel frame dati.

Risorse addizionali

I seguenti tutorial spiegano come calcolare altri valori medi in R:

Come calcolare una media troncata in R
Come calcolare la media geometrica in R
Come calcolare una media ponderata in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *