पायथन में क्रॉस सहसंबंध की गणना कैसे करें


क्रॉस-सहसंबंध एक समय श्रृंखला और किसी अन्य समय श्रृंखला के विलंबित संस्करण के बीच समानता की डिग्री को मापने का एक तरीका है।

इस प्रकार का सहसंबंध गणना करने के लिए उपयोगी है क्योंकि यह हमें बता सकता है कि क्या एक समय श्रृंखला में मान किसी अन्य समय श्रृंखला में भविष्य के मूल्यों का पूर्वानुमान है। दूसरे शब्दों में, यह हमें बता सकता है कि क्या एक समय श्रृंखला दूसरी समय श्रृंखला के लिए एक अग्रणी संकेतक है।

इस प्रकार के सहसंबंध का उपयोग कई अलग-अलग क्षेत्रों में किया जाता है, जिनमें शामिल हैं:

व्यवसाय: विपणन व्यय को अक्सर भविष्य के व्यावसायिक राजस्व का एक प्रमुख संकेतक माना जाता है। उदाहरण के लिए, यदि कोई कंपनी एक तिमाही में विपणन पर असामान्य रूप से उच्च राशि खर्च करती है, तो कुल राजस्व x तिमाही बाद उच्च होना चाहिए।

अर्थव्यवस्था: उपभोक्ता विश्वास सूचकांक (सीसीआई) को देश के सकल घरेलू उत्पाद (जीडीपी) का एक प्रमुख संकेतक माना जाता है। उदाहरण के लिए, यदि किसी दिए गए महीने में सीसीआई उच्च है, तो जीडीपी x महीने बाद अधिक होने की संभावना है।

निम्नलिखित उदाहरण दिखाता है कि पायथन में दो समय श्रृंखलाओं के बीच क्रॉस-सहसंबंध की गणना कैसे करें।

उदाहरण: पायथन में क्रॉस सहसंबंध की गणना कैसे करें

मान लीजिए कि हमारे पास पायथन में निम्नलिखित समय श्रृंखला है जो एक निश्चित कंपनी के लिए कुल विपणन खर्च (हजारों में) और साथ ही लगातार 12 महीनों के लिए कुल राजस्व (हजारों में) दिखाती है:

 import numpy as np

#define data 
marketing = n.p. array ([3, 4, 5, 5, 7, 9, 13, 15, 12, 10, 8, 8])
income = np. array ([21, 19, 22, 24, 25, 29, 30, 34, 37, 40, 35, 30])

हम statsmodels पैकेज से ccf() फ़ंक्शन का उपयोग करके दो समय श्रृंखला के बीच प्रत्येक अंतराल के लिए क्रॉस-सहसंबंध की गणना इस प्रकार कर सकते हैं:

 import statsmodels. api as sm

#calculate cross correlation
sm. tsa . stattools . ccf (marketing, revenue, adjusted= False )

array([ 0.77109358, 0.46238654, 0.19352232, -0.06066296, -0.28159595,
       -0.44531104, -0.49159463, -0.35783655, -0.15697476, -0.03430078,
        0.01587722, 0.0070399 ])

इस आउटपुट की व्याख्या इस प्रकार करें:

  • लैग 0 पर क्रॉस-सहसंबंध 0.771 है।
  • लैग 1 पर क्रॉस-सहसंबंध 0.462 है।
  • लैग 2 पर क्रॉस-सहसंबंध 0.194 है।
  • लैग 3 पर क्रॉस-सहसंबंध -0.061 है।

और इसी तरह।

ध्यान दें कि जैसे-जैसे अंतराल की संख्या बढ़ती है, दो समय श्रृंखलाओं के बीच सहसंबंध कम और सकारात्मक होता जाता है। यह हमें बताता है कि किसी दिए गए महीने में मार्केटिंग खर्च एक या दो महीने बाद के राजस्व का काफी पूर्वानुमान लगाता है, लेकिन दो महीने से अधिक के राजस्व का पूर्वानुमान नहीं लगाता है।

इससे सहज समझ बनती है: हम उम्मीद करेंगे कि किसी दिए गए महीने में उच्च विपणन व्यय अगले दो महीनों में राजस्व में वृद्धि का पूर्वानुमान होगा, लेकिन जरूरी नहीं कि अब से कई महीनों में राजस्व में वृद्धि हो।

अतिरिक्त संसाधन

पायथन में ऑटोसहसंबंध की गणना कैसे करें
पायथन में आंशिक सहसंबंध की गणना कैसे करें
पायथन में बिंदु-द्विक्रमिक सहसंबंध की गणना कैसे करें

एक टिप्पणी जोड़ने

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *