डेटा को कैसे डिट्रेंड करें: उदाहरणों के साथ


समय श्रृंखला डेटा को “ट्रेंडिंग” करने का अर्थ है डेटा में अंतर्निहित प्रवृत्ति को हटाना। हम ऐसा करना चाहते हैं इसका मुख्य कारण मौसमी या चक्रीय डेटा में अंतर्निहित रुझानों को अधिक आसानी से देखना है।

उदाहरण के लिए, निम्नलिखित समय श्रृंखला डेटा पर विचार करें जो लगातार 20 अवधियों के लिए कंपनी की कुल बिक्री का प्रतिनिधित्व करता है:

समय श्रृंखला डेटा का विस्तार करें

जाहिर है, समय के साथ बिक्री बढ़ती है, लेकिन डेटा में एक चक्रीय या मौसमी प्रवृत्ति भी दिखाई देती है, जैसा कि समय के साथ होने वाली छोटी “पहाड़ियों” से पता चलता है।

इस चक्रीय प्रवृत्ति को बेहतर ढंग से देखने के लिए, हम डेटा को ख़राब कर सकते हैं। इस मामले में, इसमें समय के साथ समग्र उर्ध्वगामी प्रवृत्ति को हटाना शामिल होगा ताकि परिणामी डेटा केवल चक्रीय प्रवृत्ति का प्रतिनिधित्व करे।

डिट्रेन्डेड टाइम सीरीज़ डेटा का उदाहरण

समय श्रृंखला डेटा को ख़राब करने के लिए दो सामान्य तरीकों का उपयोग किया जाता है:

1. विभेदन द्वारा प्रवृत्ति

2. मॉडल फिटिंग द्वारा गिरावट

यह ट्यूटोरियल प्रत्येक विधि का संक्षिप्त विवरण प्रदान करता है।

विधि 1: विभेदन द्वारा विश्राम

समय श्रृंखला डेटा को कम करने का एक तरीका बस एक नया डेटा सेट बनाना है जिसमें प्रत्येक अवलोकन अपने और पिछले अवलोकन के बीच अंतर का प्रतिनिधित्व करता है।

उदाहरण के लिए, निम्न छवि दिखाती है कि डेटा श्रृंखला को अलग करने के लिए विभेदीकरण का उपयोग कैसे करें।

डिट्रेंडेड समय श्रृंखला डेटा का पहला मान प्राप्त करने के लिए, हम 13 – 8 = 5 की गणना करते हैं। फिर, अगला मान प्राप्त करने के लिए, हम 18-13 = 5 की गणना करते हैं, और इसी तरह।

समय श्रृंखला डेटा को विभेदित करके उसका विस्तार करें

निम्नलिखित चार्ट मूल समय श्रृंखला डेटा दिखाता है:

समय श्रृंखला डेटा का विस्तार करें

और यह चार्ट बिना किसी रुझान वाला डेटा दिखाता है:

डिट्रेन्डेड टाइम सीरीज़ डेटा का उदाहरण

ध्यान दें कि इस चार्ट में समय श्रृंखला डेटा में मौसमी रुझान को देखना कितना आसान है क्योंकि समग्र ऊपर की ओर रुझान हटा दिया गया है।

विधि 2: मॉडल फिटिंग द्वारा गिरावट

समय श्रृंखला डेटा को विकृत करने का एक अन्य तरीका डेटा में एक प्रतिगमन मॉडल को फिट करना है और फिर देखे गए मूल्यों और मॉडल के अनुमानित मूल्यों के बीच अंतर की गणना करना है।

उदाहरण के लिए, मान लें कि हमारे पास समान डेटा सेट है:

यदि हम डेटा में एक सरल रैखिक प्रतिगमन मॉडल फिट करते हैं, तो हम डेटासेट में प्रत्येक अवलोकन के लिए अनुमानित मूल्य प्राप्त कर सकते हैं।

फिर हम प्रत्येक अवलोकन के लिए वास्तविक मूल्य और अनुमानित मूल्य के बीच अंतर पा सकते हैं। ये अंतर प्रचलित डेटा का प्रतिनिधित्व करते हैं।

मॉडल फिटिंग द्वारा डेटा डिट्रेंडिंग

यदि हम बिना किसी प्रवृत्ति के डेटा का एक ग्राफ़ बनाते हैं, तो हम डेटा के मौसमी या चक्रीय रुझान को अधिक आसानी से देख सकते हैं:

ध्यान दें कि हमने इस उदाहरण में रैखिक प्रतिगमन का उपयोग किया है, लेकिन यदि डेटा में एक घातीय ऊपर या नीचे की प्रवृत्ति अधिक है तो घातीय प्रतिगमन जैसी अधिक जटिल विधि का उपयोग करना संभव है।

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *