วิธีการคำนวณความสัมพันธ์ข้ามใน r


ความสัมพันธ์ข้าม เป็นวิธีการวัดระดับความคล้ายคลึงกันระหว่างอนุกรมเวลาและเวอร์ชันที่ล่าช้าของอนุกรมเวลาอื่น

ความสัมพันธ์ประเภทนี้มีประโยชน์ในการคำนวณเพราะสามารถบอกเราได้ว่าค่าในอนุกรมเวลาหนึ่งเป็นการทำนายค่าในอนาคตในอนุกรมเวลาอื่นหรือไม่ กล่าวอีกนัยหนึ่ง มันสามารถบอกเราว่าอนุกรมเวลาหนึ่งเป็นตัวบ่งชี้ที่สำคัญสำหรับอนุกรมเวลาอื่นหรือไม่

ความสัมพันธ์ประเภทนี้ถูกนำมาใช้ในหลายสาขา ได้แก่:

เศรษฐกิจ: ดัชนีความเชื่อมั่นผู้บริโภค (CCI) ถือเป็นตัวบ่งชี้ชั้นนำของผลิตภัณฑ์มวลรวมภายในประเทศ (GDP) ของประเทศ ตัวอย่างเช่น หาก CCI สูงในเดือนหนึ่ง GDP ก็มีแนวโน้มที่จะสูงขึ้น x เดือนต่อมา

ธุรกิจ: การใช้จ่ายด้านการตลาดมักถือเป็นตัวบ่งชี้ชั้นนำของรายได้ทางธุรกิจในอนาคต ตัวอย่างเช่น หากบริษัทใช้จ่ายเงินจำนวนมากผิดปกติเพื่อการตลาดในหนึ่งไตรมาส รายได้รวมก็ควรจะสูง x ไตรมาสในภายหลัง

ชีววิทยา: มลพิษในมหาสมุทรโดยรวมถือเป็นตัวบ่งชี้ที่สำคัญของประชากรเต่าบางสายพันธุ์ ตัวอย่างเช่น หากมลพิษสูงขึ้นในปีหนึ่งๆ คาดว่าจำนวนเต่าทั้งหมดจะลดลง x ปีต่อมา

ตัวอย่างต่อไปนี้แสดงวิธีคำนวณความสัมพันธ์ข้ามระหว่างอนุกรมเวลาสองอนุกรมใน R

ตัวอย่าง: วิธีคำนวณความสัมพันธ์ข้ามใน R

สมมติว่าเรามีอนุกรมเวลาต่อไปนี้ใน R ซึ่งแสดงการใช้จ่ายทางการตลาดทั้งหมด (เป็นพัน) สำหรับบริษัทหนึ่งๆ รวมถึงรายได้รวม (เป็นพัน) เป็นเวลา 12 เดือนติดต่อกัน:

 #define data
marketing <- c(3, 4, 5, 5, 7, 9, 13, 15, 12, 10, 8, 8)
revenue <- c(21, 19, 22, 24, 25, 29, 30, 34, 37, 40, 35, 30)

เราสามารถคำนวณความสัมพันธ์ข้ามสำหรับแต่ละความล่าช้าระหว่างอนุกรมเวลาสองชุดได้โดยใช้ฟังก์ชัน ccf() ดังนี้

 #calculate cross correlation
ccf(marketing, revenue)

ความสัมพันธ์ข้ามในอาร์

แผนภูมินี้แสดงความสัมพันธ์ระหว่างอนุกรมเวลาสองชุดในช่วงหน่วงที่ต่างกัน

ในการแสดงค่าความสัมพันธ์ที่แท้จริง เราสามารถใช้ไวยากรณ์ต่อไปนี้:

 #display cross correlation values
print (ccf(marketing, revenue))

Autocorrelations of series 'X', by lag

    -7 -6 -5 -4 -3 -2 -1 0 1 2 3 
-0.430 -0.351 -0.190 0.123 0.489 0.755 0.868 0.771 0.462 0.194 -0.061 
     4 5 6 7 
-0.282 -0.445 -0.492 -0.358

ต่อไปนี้เป็นวิธีตีความผลลัพธ์นี้:

  • ความสัมพันธ์ข้ามที่ lag 0 คือ 0.771
  • ความสัมพันธ์ข้ามที่ความล่าช้า 1 คือ 0.462
  • ความสัมพันธ์ข้ามที่ lag 2 คือ 0.194
  • ความสัมพันธ์ข้ามที่ lag 3 คือ -0.061

และอื่นๆ

โปรดทราบว่าความสัมพันธ์ระหว่างอนุกรมเวลาทั้งสองนั้นค่อนข้างเป็นบวกโดยมีความล่าช้า -2 ถึง 2 ซึ่งบอกเราว่าการใช้จ่ายด้านการตลาดในเดือนที่กำหนดสามารถคาดการณ์รายได้ได้ค่อนข้างมากในหนึ่งและสองเดือนต่อมา

สิ่งนี้สมเหตุสมผล: เราคาดหวังว่าการใช้จ่ายด้านการตลาดที่สูงในเดือนหนึ่งๆ จะเป็นการคาดการณ์ถึงรายได้ที่เพิ่มขึ้นในอีกสองเดือนข้างหน้า

แหล่งข้อมูลเพิ่มเติม

วิธีการคำนวณความสัมพันธ์อัตโนมัติใน R
วิธีการคำนวณความสัมพันธ์บางส่วนใน R
วิธีการคำนวณความสัมพันธ์แบบเลื่อนใน R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *