Jak usunąć trend danych: z przykładami
„Wyeliminowanie trendu” danych szeregów czasowych oznacza usunięcie podstawowego trendu w danych. Głównym powodem, dla którego chcemy to zrobić, jest łatwiejsza wizualizacja podstawowych trendów w danych sezonowych lub cyklicznych.
Rozważmy na przykład następujące dane szeregów czasowych, które reprezentują całkowitą sprzedaż firmy w 20 kolejnych okresach:
Oczywiście sprzedaż zwykle rośnie z biegiem czasu, ale wydaje się, że dane wykazują również tendencję cykliczną lub sezonową, o czym świadczą drobne „wzgórza” pojawiające się w czasie.
Aby uzyskać lepszy obraz tego cyklicznego trendu, możemy deflować dane. W tym przypadku oznaczałoby to usunięcie ogólnego trendu wzrostowego w czasie, tak aby uzyskane dane przedstawiały jedynie trend cykliczny.
Istnieją dwie popularne metody deflacji danych szeregów czasowych:
1. Tendencja przez różnicowanie
2. Degradacja poprzez dopasowanie modelu
Ten samouczek zawiera krótkie wyjaśnienie każdej metody.
Metoda 1: Relaksacja przez różnicowanie
Jednym ze sposobów usunięcia trendu danych szeregów czasowych jest po prostu utworzenie nowego zbioru danych, w którym każda obserwacja reprezentuje różnicę między nią samą a poprzednią obserwacją.
Na przykład poniższy obraz pokazuje, jak używać różnicowania w celu ograniczenia serii danych.
Aby uzyskać pierwszą wartość danych szeregu czasowego z detrendem, obliczamy 13 – 8 = 5. Następnie, aby uzyskać kolejną wartość, obliczamy 18-13 = 5 i tak dalej.
Poniższy wykres przedstawia oryginalne dane szeregów czasowych:
A ten wykres pokazuje dane bez trendu:
Zwróć uwagę, o ile łatwiej jest zobaczyć trend sezonowy w danych szeregów czasowych na tym wykresie, ponieważ ogólny trend wzrostowy został usunięty.
Metoda 2: Degradacja poprzez dopasowanie modelu
Innym sposobem na usunięcie trendu z danych szeregów czasowych jest dopasowanie modelu regresji do danych, a następnie obliczenie różnicy między wartościami obserwowanymi a wartościami przewidywanymi przez model.
Załóżmy na przykład, że mamy ten sam zestaw danych:
Jeśli dopasujemy do danych prosty model regresji liniowej , możemy uzyskać przewidywaną wartość dla każdej obserwacji w zbiorze danych.
Następnie możemy znaleźć różnicę między wartością rzeczywistą a wartością przewidywaną dla każdej obserwacji. Różnice te reprezentują dane pozbawione trendów.
Jeśli utworzymy wykres danych bez trendu, możemy znacznie łatwiej zwizualizować sezonowy lub cykliczny trend danych:
Należy zauważyć, że w tym przykładzie użyliśmy regresji liniowej, ale możliwe jest zastosowanie bardziej złożonej metody, takiej jak regresja wykładnicza, jeśli w danych występuje bardziej wykładniczy trend wzrostowy lub spadkowy.