R'de kümülatif ortalama nasıl hesaplanır


Kümülatif ortalama bize bir dizi değerin belirli bir noktaya kadar ortalamasını anlatır.

R’deki değerlerin kümülatif ortalamasını hesaplamak için aşağıdaki yöntemleri kullanabilirsiniz:

Yöntem 1: Temel R’yi Kullan

 cum_avg <- cumsum(x) / seq_along(x)

Yöntem 2: dplyr’ı kullanın

 library (dplyr)

cum_avg <- cummean(x)

Her iki yöntem de tam olarak aynı sonucu verir, ancak dplyr yöntemi büyük veri çerçevelerinde daha hızlı performans gösterme eğilimindedir.

Aşağıdaki örnekler, R’deki aşağıdaki veri çerçevesiyle her yöntemin pratikte nasıl kullanılacağını gösterir:

 #create data frame
df <- data. frame (day=seq(1:16),
                 sales=c(3, 6, 0, 2, 4, 1, 0, 1, 4, 7, 3, 3, 8, 3, 5, 5))

#view head of data frame
head(df)

  day sales
1 1 3
2 2 6
3 3 0
4 4 2
5 5 4
6 6 1

Örnek 1: R tabanını kullanarak kümülatif ortalamayı hesaplayın

Veri çerçevemize kümülatif satış ortalamasını görüntüleyen yeni bir sütun eklemek için aşağıdaki kodu kullanabiliriz:

 #add new column that contains cumulative avg. of sales
df$cum_avg_sales <- cumsum(df$sales) / seq_along(df$sales) 

#view updated data frame
df

   day sales cum_avg_sales
1 1 3 3.000000
2 2 6 4.500000
3 3 0 3.000000
4 4 2 2.750000
5 5 4 3.000000
6 6 1 2.666667
7 7 0 2.285714
8 8 1 2.125000
9 9 4 2.333333
10 10 7 2.800000
11 11 3 2.818182
12 12 3 2.833333
13 13 8 3.230769
14 14 3 3.214286
15 15 5 3.333333
16 16 5 3.437500

Kümülatif ortalama değerleri şu şekilde yorumlayabiliriz:

  • İlk satışların değerinin kümülatif ortalaması 3’tür .
  • İlk iki satış değerinin kümülatif ortalaması 4,5’tir .
  • İlk üç satış değerinin kümülatif ortalaması 3’tür .
  • İlk dört satış değerinin kümülatif ortalaması 2,75’tir .

Ve benzeri.

Örnek 2: dplyr kullanarak kümülatif ortalamayı hesaplama

Kümülatif ortalamayı hesaplamak için R’deki dplyr paketindeki cummean fonksiyonunu da kullanabiliriz.

Aşağıdaki kod, veri çerçevemize kümülatif satış ortalamasını görüntüleyen yeni bir sütun eklemek için bu işlevin nasıl kullanılacağını gösterir:

 library (dplyr)

#add new column that contains cumulative avg. of sales
df$cum_avg_sales <- cummean(df$sales) 

#view updated data frame
df

   day sales cum_avg_sales
1 1 3 3.000000
2 2 6 4.500000
3 3 0 3.000000
4 4 2 2.750000
5 5 4 3.000000
6 6 1 2.666667
7 7 0 2.285714
8 8 1 2.125000
9 9 4 2.333333
10 10 7 2.800000
11 11 3 2.818182
12 12 3 2.833333
13 13 8 3.230769
14 14 3 3.214286
15 15 5 3.333333
16 16 5 3.437500

Bu yöntemin önceki yöntemle tamamen aynı sonuçları döndürdüğünü unutmayın.

Ek kaynaklar

Aşağıdaki eğitimlerde R’deki diğer yaygın metriklerin nasıl hesaplanacağı açıklanmaktadır:

R’de kırpılmış ortalama nasıl hesaplanır
R’de geometrik ortalama nasıl hesaplanır
R’de ağırlıklı ortalama nasıl hesaplanır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir