R'de kaydırma değerleri nasıl hesaplanır (örneklerle)


Gecikme değerlerini hesaplamak için R’deki dplyr paketindeki lag() işlevini kullanabilirsiniz.

Bu işlev aşağıdaki temel sözdizimini kullanır:

ofset(x, n=1, …)

Altın:

  • x : değerlerin vektörü
  • n : geciktirilecek konum sayısı

Aşağıdaki örnek, pratikte kaydırılan değerleri hesaplamak için bu fonksiyonun nasıl kullanılacağını göstermektedir.

Örnek: R’de Kaydırılmış Değerlerin Hesaplanması

R’de bir mağazanın art arda 10 gün boyunca yaptığı satış sayısını gösteren aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:

 #create data frame
df <- data. frame (day=1:10,
                 sales=c(18, 10, 14, 13, 19, 24, 25, 29, 15, 18))

#view data frame
df

   day sales
1 1 18
2 2 10
3 3 14
4 4 13
5 5 19
6 6 24
7 7 25
8 8 29
9 9 15
10 10 18

Her satırda önceki günün satışlarını görüntüleyen bir gecikme sütunu oluşturmak için dplyr paketindeki lag() işlevini kullanabiliriz:

 library (dplyr)

#add new column that shows sales for previous day
df$previous_day_sales <- dplyr::lag(df$sales, n= 1 )

#view updated data frame
df

   day sales previous_day_sales
1 1 18 NA
2 2 10 18
3 3 14 10
4 4 13 14
5 5 19 13
6 6 24 19
7 7 25 24
8 8 29 25
9 9 15 29
10 10 18 15

Sonucun nasıl yorumlanacağı aşağıda açıklanmıştır:

  • Satış sütununda herhangi bir öncelik değeri olmadığından mahsup sütunundaki ilk değer NA’dır .
  • Ofset sütunundaki ikinci değer, satış sütunundaki bir önceki değer olduğundan 18’dir .
  • Ofset sütunundaki üçüncü değer, satış sütunundaki bir önceki değer olduğundan 10’dur .

Ve benzeri.

Farklı sayıdaki önceki konumlar için bir gecikme değeri hesaplamak amacıyla lag() işlevindeki n argümanının değerini de değiştirebiliriz:

 library (dplyr)

#add new column that shows sales for two days prior
df$previous_day_sales <- dplyr::lag(df$sales, n= 2 )

#view updated data frame
df

   day sales previous_day_sales
1 1 18 NA
2 2 10 NA
3 3 14 18
4 4 13 10
5 5 19 14
6 6 24 13
7 7 25 19
8 8 29 24
9 9 15 25
10 10 18 29

Not : Bir öncü sütun oluşturmak için lag() işlevi yerine dplyr paketindeki lead() işlevini kullanın.

Ek kaynaklar

Aşağıdaki eğitimlerde R’deki diğer yaygın işlevlerin nasıl kullanılacağı açıklanmaktadır:

Dplyr’de n() işlevi nasıl kullanılır?
Dplyr’de cross () işlevi nasıl kullanılır?
Dplyr’de relocate () işlevi nasıl kullanılır?
Dplyr’de dilim () işlevi nasıl kullanılır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir