วิธีแก้ไขข้อมูล: พร้อมตัวอย่าง
ข้อมูลอนุกรมเวลา “Detrending” หมายถึงการลบแนวโน้มที่ซ่อนอยู่ในข้อมูล เหตุผลหลักที่เราต้องการทำเช่นนี้คือเพื่อให้เห็นภาพแนวโน้มที่ซ่อนอยู่ในข้อมูลตามฤดูกาลหรือตามวัฏจักรได้ง่ายขึ้น
ตัวอย่างเช่น พิจารณาข้อมูลอนุกรมเวลาต่อไปนี้ที่แสดงถึงยอดขายรวมของบริษัทเป็นเวลา 20 รอบติดต่อกัน:
แน่นอนว่ายอดขายมีแนวโน้มที่จะเพิ่มขึ้นเมื่อเวลาผ่านไป แต่ข้อมูลก็ดูเหมือนจะมีแนวโน้มเป็นวัฏจักรหรือตามฤดูกาลด้วย โดยเห็นได้จาก “เนิน” เล็กๆ ที่เกิดขึ้นเมื่อเวลาผ่านไป
เพื่อให้เห็นภาพแนวโน้มวัฏจักรนี้ได้ดีขึ้น เราสามารถยุบข้อมูลได้ ในกรณีนี้ จะเกี่ยวข้องกับการลบแนวโน้มขาขึ้นโดยรวมในช่วงเวลาหนึ่ง เพื่อให้ข้อมูลผลลัพธ์แสดงเฉพาะแนวโน้มแบบวัฏจักรเท่านั้น
มีสองวิธีทั่วไปที่ใช้ในการยุบข้อมูลอนุกรมเวลา:
1. แนวโน้มโดยความแตกต่าง
2. การเสื่อมสภาพตามแบบจำลอง
บทช่วยสอนนี้จะอธิบายโดยย่อของแต่ละวิธี
วิธีที่ 1: การผ่อนคลายโดยการสร้างความแตกต่าง
วิธีหนึ่งในการลดแนวโน้มข้อมูลอนุกรมเวลาคือเพียงสร้างชุดข้อมูลใหม่ โดยแต่ละการสังเกตแสดงถึงความแตกต่างระหว่างตัวมันเองกับการสังเกตครั้งก่อน
ตัวอย่างเช่น รูปภาพต่อไปนี้แสดงวิธีใช้การแยกความแตกต่างเพื่อลดแนวโน้มชุดข้อมูล
หากต้องการรับค่าแรกของข้อมูลอนุกรมเวลาที่ไม่มีแนวโน้ม เราจะคำนวณ 13 – 8 = 5 จากนั้นหากต้องการรับค่าถัดไป เราจะคำนวณ 18-13 = 5 ไปเรื่อยๆ
แผนภูมิต่อไปนี้แสดงข้อมูลอนุกรมเวลาดั้งเดิม:
และแผนภูมินี้แสดงข้อมูลที่ไม่มีแนวโน้ม:
สังเกตว่าการดูแนวโน้มตามฤดูกาลในข้อมูลอนุกรมเวลาในแผนภูมินี้ทำได้ง่ายกว่ามากเพียงใด เนื่องจากแนวโน้มขาขึ้นโดยรวมถูกลบออกแล้ว
วิธีที่ 2: การย่อยสลายโดยการปรับแบบจำลอง
อีกวิธีหนึ่งในการลดแนวโน้มข้อมูลอนุกรมเวลาคือการปรับแบบจำลองการถดถอยให้พอดีกับข้อมูล จากนั้นจึงคำนวณความแตกต่างระหว่างค่าที่สังเกตได้กับค่าที่คาดการณ์ของแบบจำลอง
ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลเดียวกัน:
หากเราใส่ แบบจำลองการถดถอยเชิงเส้นอย่างง่าย เข้ากับข้อมูล เราจะได้ค่าที่คาดการณ์ไว้สำหรับ การสังเกต แต่ละครั้งในชุดข้อมูล
จากนั้นเราจะสามารถค้นหาความแตกต่างระหว่างค่าจริงและค่าที่คาดการณ์ไว้สำหรับการสังเกตแต่ละครั้ง ความแตกต่างเหล่านี้แสดงถึงข้อมูลที่ไม่มีแนวโน้ม
หากเราสร้างกราฟของข้อมูลโดยไม่มีแนวโน้ม เราจะเห็นภาพแนวโน้มตามฤดูกาลหรือวัฏจักรของข้อมูลได้ง่ายขึ้นมาก:
โปรดทราบว่าเราใช้การถดถอยเชิงเส้นในตัวอย่างนี้ แต่เป็นไปได้ที่จะใช้วิธีการที่ซับซ้อนกว่า เช่น การถดถอยเอ็กซ์โปเนนเชียล หากข้อมูลมีแนวโน้มขึ้นหรือลงแบบเอ็กซ์โปเนนเชียลมากกว่า