Jak obliczyć średnią kolumny w r (z przykładami)


Do obliczenia średniej kolumny w R można użyć dowolnej z następujących metod:

 #calculate mean using column name
mean(df$my_column)

#calculate mean using column name (ignore missing values)
mean(df$my_column, na. rm = TRUE )

#calculate mean using column position
mean(df[, 1])

#calculation mean of all numeric columns
colMeans(df[sapply(df, is. numeric )])

Poniższe przykłady pokazują, jak używać każdej metody z następującą ramką danych w R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 points=c(99, 90, 93, 86, 88, 82),
                 assists=c(33, 28, 31, 39, NA, 30))

#view data frame
df

  team points assists
1 A 99 33
2 A 90 28
3 A 93 31
4 B 86 39
5 B 88 NA
6 B 82 30

Przykład 1: Oblicz średnią, korzystając z nazwy kolumny

Poniższy kod pokazuje, jak obliczyć średnią z kolumny „punkty” przy użyciu nazwy kolumny:

 #calculate mean of 'points' column
mean(df$points)

[1] 89.66667

Średnia wartość w kolumnie „punkty” wynosi 89,66667 .

Przykład 2: Oblicz średnią przy użyciu nazwy kolumny (zignoruj braki danych)

Jeśli spróbujemy obliczyć średnią z kolumny zawierającej brakujące wartości, otrzymamy NA :

 #attempt to calculate mean of 'assists' column
mean(df$assists)

[1] NA

Musimy użyć na.rm=TRUE , aby zignorować brakujące wartości podczas obliczania średniej kolumny:

 #calculate mean of 'assists' column and ignore missing values
mean(df$assists, na. rm = TRUE )

[1] 32.2

Średnia wartość w kolumnie „asysty” to 32,2 .

Przykład 3: Oblicz średnią, korzystając z pozycji kolumny

Poniższy kod pokazuje, jak obliczyć średnią kolumnę na pozycji indeksu 2:

 #calculate mean of column in index position 2
mean(df[, 2])

[1] 89.66667

Średnia wartość kolumny na pozycji indeksu 2 (kolumna „punkty”) wynosi 89,66667 .

Przykład 4: Oblicz średnią ze wszystkich kolumn liczbowych

Poniższy kod pokazuje, jak obliczyć średnią ze wszystkich kolumn liczbowych w ramce danych:

 #calculate mean of all numeric columns
colMeans(df[sapply(df, is. numeric )], na. rm = TRUE )

  assist points 
89.66667 32.20000

Dane wyjściowe wyświetlają średnią wartość każdej kolumny liczbowej w ramce danych.

Dodatkowe zasoby

Poniższe tutoriale wyjaśniają, jak obliczyć inne wartości średnie w R:

Jak obliczyć średnią obciętą w R
Jak obliczyć średnią geometryczną w R
Jak obliczyć średnią ważoną w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *