R'de kümülatif ortalama nasıl hesaplanır
Kümülatif ortalama bize bir dizi değerin belirli bir noktaya kadar ortalamasını anlatır.
R’deki değerlerin kümülatif ortalamasını hesaplamak için aşağıdaki yöntemleri kullanabilirsiniz:
Yöntem 1: Temel R’yi Kullan
cum_avg <- cumsum(x) / seq_along(x)
Yöntem 2: dplyr’ı kullanın
library (dplyr)
cum_avg <- cummean(x)
Her iki yöntem de tam olarak aynı sonucu verir, ancak dplyr yöntemi büyük veri çerçevelerinde daha hızlı performans gösterme eğilimindedir.
Aşağıdaki örnekler, R’deki aşağıdaki veri çerçevesiyle her yöntemin pratikte nasıl kullanılacağını gösterir:
#create data frame df <- data. frame (day=seq(1:16), sales=c(3, 6, 0, 2, 4, 1, 0, 1, 4, 7, 3, 3, 8, 3, 5, 5)) #view head of data frame head(df) day sales 1 1 3 2 2 6 3 3 0 4 4 2 5 5 4 6 6 1
Örnek 1: R tabanını kullanarak kümülatif ortalamayı hesaplayın
Veri çerçevemize kümülatif satış ortalamasını görüntüleyen yeni bir sütun eklemek için aşağıdaki kodu kullanabiliriz:
#add new column that contains cumulative avg. of sales
df$cum_avg_sales <- cumsum(df$sales) / seq_along(df$sales)
#view updated data frame
df
day sales cum_avg_sales
1 1 3 3.000000
2 2 6 4.500000
3 3 0 3.000000
4 4 2 2.750000
5 5 4 3.000000
6 6 1 2.666667
7 7 0 2.285714
8 8 1 2.125000
9 9 4 2.333333
10 10 7 2.800000
11 11 3 2.818182
12 12 3 2.833333
13 13 8 3.230769
14 14 3 3.214286
15 15 5 3.333333
16 16 5 3.437500
Kümülatif ortalama değerleri şu şekilde yorumlayabiliriz:
- İlk satışların değerinin kümülatif ortalaması 3’tür .
- İlk iki satış değerinin kümülatif ortalaması 4,5’tir .
- İlk üç satış değerinin kümülatif ortalaması 3’tür .
- İlk dört satış değerinin kümülatif ortalaması 2,75’tir .
Ve benzeri.
Örnek 2: dplyr kullanarak kümülatif ortalamayı hesaplama
Kümülatif ortalamayı hesaplamak için R’deki dplyr paketindeki cummean fonksiyonunu da kullanabiliriz.
Aşağıdaki kod, veri çerçevemize kümülatif satış ortalamasını görüntüleyen yeni bir sütun eklemek için bu işlevin nasıl kullanılacağını gösterir:
library (dplyr)
#add new column that contains cumulative avg. of sales
df$cum_avg_sales <- cummean(df$sales)
#view updated data frame
df
day sales cum_avg_sales
1 1 3 3.000000
2 2 6 4.500000
3 3 0 3.000000
4 4 2 2.750000
5 5 4 3.000000
6 6 1 2.666667
7 7 0 2.285714
8 8 1 2.125000
9 9 4 2.333333
10 10 7 2.800000
11 11 3 2.818182
12 12 3 2.833333
13 13 8 3.230769
14 14 3 3.214286
15 15 5 3.333333
16 16 5 3.437500
Bu yöntemin önceki yöntemle tamamen aynı sonuçları döndürdüğünü unutmayın.
Ek kaynaklar
Aşağıdaki eğitimlerde R’deki diğer yaygın metriklerin nasıl hesaplanacağı açıklanmaktadır:
R’de kırpılmış ortalama nasıl hesaplanır
R’de geometrik ortalama nasıl hesaplanır
R’de ağırlıklı ortalama nasıl hesaplanır