Verilerdeki trend nasıl azaltılır: örneklerle


Zaman serisi verilerinin “trendini azaltmak”, verilerdeki temel eğilimin ortadan kaldırılması anlamına gelir. Bunu yapmak istememizin temel nedeni, mevsimsel veya döngüsel verilerdeki temel eğilimleri daha kolay görselleştirmektir.

Örneğin, bir şirketin ardışık 20 dönem boyunca toplam satışlarını temsil eden aşağıdaki zaman serisi verilerini düşünün:

Zaman serisi verilerini genişlet

Açıkçası, satışlar zamanla artma eğilimindedir, ancak zaman içinde oluşan küçük “tepelerin” de gösterdiği gibi, verilerde döngüsel veya mevsimsel bir eğilim de var gibi görünmektedir.

Bu döngüsel eğilimi daha iyi görebilmek için verileri söndürebiliriz. Bu durumda bu, zaman içindeki genel yükseliş eğiliminin ortadan kaldırılmasını ve böylece ortaya çıkan verilerin yalnızca döngüsel eğilimi temsil etmesini içerecektir.

Eğilimden arındırılmış zaman serisi verilerine örnek

Zaman serisi verilerini azaltmak için kullanılan iki yaygın yöntem vardır:

1. Farklılaşma yoluyla eğilim

2. Model uyumu nedeniyle bozulma

Bu eğitimde her yöntemin kısa bir açıklaması verilmektedir.

Yöntem 1: Farklılaşma yoluyla gevşeme

Zaman serisi verilerinin trendini azaltmanın bir yolu, her gözlemin kendisi ile önceki gözlem arasındaki farkı temsil ettiği yeni bir veri seti oluşturmaktır.

Örneğin, aşağıdaki resimde bir veri serisinin eğilimini azaltmak için farklılaştırmanın nasıl kullanılacağı gösterilmektedir.

Trendsiz zaman serisi verilerinin ilk değerini elde etmek için 13 – 8 = 5’i hesaplıyoruz. Daha sonra bir sonraki değeri elde etmek için 18-13 = 5’i hesaplıyoruz ve bu şekilde devam ediyor.

Zaman serisi verilerini farklılaştırarak genişletin

Aşağıdaki grafik orijinal zaman serisi verilerini göstermektedir:

Zaman serisi verilerini genişlet

Bu grafikte trend olmayan veriler gösteriliyor:

Eğilimden arındırılmış zaman serisi verilerine örnek

Genel yükseliş eğilimi kaldırıldığı için bu grafikteki zaman serisi verilerinde mevsimsel eğilimi görmenin ne kadar kolay olduğuna dikkat edin.

Yöntem 2: Model uydurma yoluyla bozulma

Zaman serisi verilerinin trendini azaltmanın bir diğer yolu da verilere bir regresyon modeli sığdırmak ve ardından gözlemlenen değerler ile modelin tahmin edilen değerleri arasındaki farkı hesaplamaktır.

Örneğin, aynı veri setine sahip olduğumuzu varsayalım:

Verilere basit bir doğrusal regresyon modeli uygularsak veri kümesindeki her gözlem için tahmin edilen bir değer elde edebiliriz.

Daha sonra her gözlem için gerçek değer ile tahmin edilen değer arasındaki farkı bulabiliriz. Bu farklılıklar trendi bozulmuş verileri temsil eder.

Model uyumuyla verilerin eğilimini azaltma

Trendsiz verilerin grafiğini oluşturursak, verilerin mevsimsel veya döngüsel eğilimini çok daha kolay görselleştirebiliriz:

Bu örnekte doğrusal regresyon kullandığımızı unutmayın, ancak verilerde daha fazla üstel yukarı veya aşağı eğilim varsa üstel regresyon gibi daha karmaşık bir yöntem kullanmak mümkündür.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir