Jak usunąć trend danych: z przykładami


„Wyeliminowanie trendu” danych szeregów czasowych oznacza usunięcie podstawowego trendu w danych. Głównym powodem, dla którego chcemy to zrobić, jest łatwiejsza wizualizacja podstawowych trendów w danych sezonowych lub cyklicznych.

Rozważmy na przykład następujące dane szeregów czasowych, które reprezentują całkowitą sprzedaż firmy w 20 kolejnych okresach:

Rozwiń dane szeregów czasowych

Oczywiście sprzedaż zwykle rośnie z biegiem czasu, ale wydaje się, że dane wykazują również tendencję cykliczną lub sezonową, o czym świadczą drobne „wzgórza” pojawiające się w czasie.

Aby uzyskać lepszy obraz tego cyklicznego trendu, możemy deflować dane. W tym przypadku oznaczałoby to usunięcie ogólnego trendu wzrostowego w czasie, tak aby uzyskane dane przedstawiały jedynie trend cykliczny.

Przykład zdetrenowanych danych szeregów czasowych

Istnieją dwie popularne metody deflacji danych szeregów czasowych:

1. Tendencja przez różnicowanie

2. Degradacja poprzez dopasowanie modelu

Ten samouczek zawiera krótkie wyjaśnienie każdej metody.

Metoda 1: Relaksacja przez różnicowanie

Jednym ze sposobów usunięcia trendu danych szeregów czasowych jest po prostu utworzenie nowego zbioru danych, w którym każda obserwacja reprezentuje różnicę między nią samą a poprzednią obserwacją.

Na przykład poniższy obraz pokazuje, jak używać różnicowania w celu ograniczenia serii danych.

Aby uzyskać pierwszą wartość danych szeregu czasowego z detrendem, obliczamy 13 – 8 = 5. Następnie, aby uzyskać kolejną wartość, obliczamy 18-13 = 5 i tak dalej.

Rozwiń dane szeregów czasowych, różnicując je

Poniższy wykres przedstawia oryginalne dane szeregów czasowych:

Rozwiń dane szeregów czasowych

A ten wykres pokazuje dane bez trendu:

Przykład zdetrenowanych danych szeregów czasowych

Zwróć uwagę, o ile łatwiej jest zobaczyć trend sezonowy w danych szeregów czasowych na tym wykresie, ponieważ ogólny trend wzrostowy został usunięty.

Metoda 2: Degradacja poprzez dopasowanie modelu

Innym sposobem na usunięcie trendu z danych szeregów czasowych jest dopasowanie modelu regresji do danych, a następnie obliczenie różnicy między wartościami obserwowanymi a wartościami przewidywanymi przez model.

Załóżmy na przykład, że mamy ten sam zestaw danych:

Jeśli dopasujemy do danych prosty model regresji liniowej , możemy uzyskać przewidywaną wartość dla każdej obserwacji w zbiorze danych.

Następnie możemy znaleźć różnicę między wartością rzeczywistą a wartością przewidywaną dla każdej obserwacji. Różnice te reprezentują dane pozbawione trendów.

Usuwanie trendów danych poprzez dopasowanie modelu

Jeśli utworzymy wykres danych bez trendu, możemy znacznie łatwiej zwizualizować sezonowy lub cykliczny trend danych:

Należy zauważyć, że w tym przykładzie użyliśmy regresji liniowej, ale możliwe jest zastosowanie bardziej złożonej metody, takiej jak regresja wykładnicza, jeśli w danych występuje bardziej wykładniczy trend wzrostowy lub spadkowy.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *