Cara menghitung rata-rata kumulatif dalam r
Rata-rata kumulatif memberi tahu kita rata-rata serangkaian nilai hingga titik tertentu.
Anda dapat menggunakan metode berikut untuk menghitung rata-rata kumulatif nilai di R:
Metode 1: Gunakan Basis R
cum_avg <- cumsum(x) / seq_along(x)
Metode 2: gunakan dplyr
library (dplyr)
cum_avg <- cummean(x)
Kedua metode memberikan hasil yang sama persis, namun metode dplyr cenderung bekerja lebih cepat pada frame data besar.
Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut di R:
#create data frame df <- data. frame (day=seq(1:16), sales=c(3, 6, 0, 2, 4, 1, 0, 1, 4, 7, 3, 3, 8, 3, 5, 5)) #view head of data frame head(df) day sales 1 1 3 2 2 6 3 3 0 4 4 2 5 5 4 6 6 1
Contoh 1: Hitung rata-rata kumulatif menggunakan basis R
Kita dapat menggunakan kode berikut untuk menambahkan kolom baru ke bingkai data yang menampilkan rata-rata penjualan kumulatif:
#add new column that contains cumulative avg. of sales
df$cum_avg_sales <- cumsum(df$sales) / seq_along(df$sales)
#view updated data frame
df
day sales cum_avg_sales
1 1 3 3.000000
2 2 6 4.500000
3 3 0 3.000000
4 4 2 2.750000
5 5 4 3.000000
6 6 1 2.666667
7 7 0 2.285714
8 8 1 2.125000
9 9 4 2.333333
10 10 7 2.800000
11 11 3 2.818182
12 12 3 2.833333
13 13 8 3.230769
14 14 3 3.214286
15 15 5 3.333333
16 16 5 3.437500
Kami akan menafsirkan nilai rata-rata kumulatif sebagai:
- Rata-rata kumulatif nilai penjualan pertama adalah 3 .
- Rata-rata kumulatif dari dua nilai penjualan pertama adalah 4,5 .
- Rata-rata kumulatif dari tiga nilai penjualan pertama adalah 3 .
- Rata-rata kumulatif dari empat nilai penjualan pertama adalah 2,75 .
Dan seterusnya.
Contoh 2: Hitung rata-rata kumulatif menggunakan dplyr
Kita juga dapat menggunakan fungsi cummean dari paket dplyr di R untuk menghitung rata-rata kumulatif.
Kode berikut menunjukkan cara menggunakan fungsi ini untuk menambahkan kolom baru ke bingkai data kami yang menampilkan rata-rata penjualan kumulatif:
library (dplyr)
#add new column that contains cumulative avg. of sales
df$cum_avg_sales <- cummean(df$sales)
#view updated data frame
df
day sales cum_avg_sales
1 1 3 3.000000
2 2 6 4.500000
3 3 0 3.000000
4 4 2 2.750000
5 5 4 3.000000
6 6 1 2.666667
7 7 0 2.285714
8 8 1 2.125000
9 9 4 2.333333
10 10 7 2.800000
11 11 3 2.818182
12 12 3 2.833333
13 13 8 3.230769
14 14 3 3.214286
15 15 5 3.333333
16 16 5 3.437500
Perhatikan bahwa metode ini mengembalikan hasil yang sama persis dengan metode sebelumnya.
Sumber daya tambahan
Tutorial berikut menjelaskan cara menghitung metrik umum lainnya di R:
Cara menghitung mean terpangkas di R
Cara menghitung mean geometrik di R
Cara menghitung rata-rata tertimbang dalam R