Cara menghitung rata-rata kolom di r (dengan contoh)


Anda dapat menggunakan salah satu metode berikut untuk menghitung rata-rata kolom di R:

 #calculate mean using column name
mean(df$my_column)

#calculate mean using column name (ignore missing values)
mean(df$my_column, na. rm = TRUE )

#calculate mean using column position
mean(df[, 1])

#calculation mean of all numeric columns
colMeans(df[sapply(df, is. numeric )])

Contoh berikut menunjukkan cara menggunakan setiap metode dengan bingkai data berikut di R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 points=c(99, 90, 93, 86, 88, 82),
                 assists=c(33, 28, 31, 39, NA, 30))

#view data frame
df

  team points assists
1 A 99 33
2 A 90 28
3 A 93 31
4 B 86 39
5 B 88 NA
6 B 82 30

Contoh 1: Hitung rata-rata menggunakan nama kolom

Kode berikut menunjukkan cara menghitung rata-rata kolom “poin” menggunakan nama kolom:

 #calculate mean of 'points' column
mean(df$points)

[1] 89.66667

Nilai rata-rata pada kolom “poin” adalah 89.66667 .

Contoh 2: Hitung Rata-Rata Menggunakan Nama Kolom (Abaikan Nilai yang Hilang)

Jika kita mencoba menghitung rata-rata kolom yang berisi nilai yang hilang, kita akan mendapatkan NA :

 #attempt to calculate mean of 'assists' column
mean(df$assists)

[1] NA

Kita perlu menggunakan na.rm=TRUE untuk mengabaikan nilai yang hilang saat menghitung rata-rata kolom:

 #calculate mean of 'assists' column and ignore missing values
mean(df$assists, na. rm = TRUE )

[1] 32.2

Nilai rata-rata pada kolom “bantuan” adalah 32,2 .

Contoh 3: Hitung rata-rata menggunakan posisi kolom

Kode berikut menunjukkan cara menghitung rata-rata kolom pada posisi indeks 2:

 #calculate mean of column in index position 2
mean(df[, 2])

[1] 89.66667

Nilai rata-rata kolom pada posisi indeks 2 (kolom “poin”) adalah 89.66667 .

Contoh 4: Hitung rata-rata semua kolom numerik

Kode berikut menunjukkan cara menghitung rata-rata semua kolom numerik dalam bingkai data:

 #calculate mean of all numeric columns
colMeans(df[sapply(df, is. numeric )], na. rm = TRUE )

  assist points 
89.66667 32.20000

Outputnya menampilkan nilai rata-rata setiap kolom numerik dalam bingkai data.

Sumber daya tambahan

Tutorial berikut menjelaskan cara menghitung nilai rata-rata lainnya di R:

Cara menghitung mean terpangkas di R
Cara menghitung mean geometrik di R
Cara menghitung rata-rata tertimbang dalam R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *