วิธีแก้ไขข้อมูล: พร้อมตัวอย่าง


ข้อมูลอนุกรมเวลา “Detrending” หมายถึงการลบแนวโน้มที่ซ่อนอยู่ในข้อมูล เหตุผลหลักที่เราต้องการทำเช่นนี้คือเพื่อให้เห็นภาพแนวโน้มที่ซ่อนอยู่ในข้อมูลตามฤดูกาลหรือตามวัฏจักรได้ง่ายขึ้น

ตัวอย่างเช่น พิจารณาข้อมูลอนุกรมเวลาต่อไปนี้ที่แสดงถึงยอดขายรวมของบริษัทเป็นเวลา 20 รอบติดต่อกัน:

ขยายข้อมูลอนุกรมเวลา

แน่นอนว่ายอดขายมีแนวโน้มที่จะเพิ่มขึ้นเมื่อเวลาผ่านไป แต่ข้อมูลก็ดูเหมือนจะมีแนวโน้มเป็นวัฏจักรหรือตามฤดูกาลด้วย โดยเห็นได้จาก “เนิน” เล็กๆ ที่เกิดขึ้นเมื่อเวลาผ่านไป

เพื่อให้เห็นภาพแนวโน้มวัฏจักรนี้ได้ดีขึ้น เราสามารถยุบข้อมูลได้ ในกรณีนี้ จะเกี่ยวข้องกับการลบแนวโน้มขาขึ้นโดยรวมในช่วงเวลาหนึ่ง เพื่อให้ข้อมูลผลลัพธ์แสดงเฉพาะแนวโน้มแบบวัฏจักรเท่านั้น

ตัวอย่างข้อมูลอนุกรมเวลาที่ไม่มีแนวโน้ม

มีสองวิธีทั่วไปที่ใช้ในการยุบข้อมูลอนุกรมเวลา:

1. แนวโน้มโดยความแตกต่าง

2. การเสื่อมสภาพตามแบบจำลอง

บทช่วยสอนนี้จะอธิบายโดยย่อของแต่ละวิธี

วิธีที่ 1: การผ่อนคลายโดยการสร้างความแตกต่าง

วิธีหนึ่งในการลดแนวโน้มข้อมูลอนุกรมเวลาคือเพียงสร้างชุดข้อมูลใหม่ โดยแต่ละการสังเกตแสดงถึงความแตกต่างระหว่างตัวมันเองกับการสังเกตครั้งก่อน

ตัวอย่างเช่น รูปภาพต่อไปนี้แสดงวิธีใช้การแยกความแตกต่างเพื่อลดแนวโน้มชุดข้อมูล

หากต้องการรับค่าแรกของข้อมูลอนุกรมเวลาที่ไม่มีแนวโน้ม เราจะคำนวณ 13 – 8 = 5 จากนั้นหากต้องการรับค่าถัดไป เราจะคำนวณ 18-13 = 5 ไปเรื่อยๆ

ขยายข้อมูลอนุกรมเวลาโดยการแยกความแตกต่าง

แผนภูมิต่อไปนี้แสดงข้อมูลอนุกรมเวลาดั้งเดิม:

ขยายข้อมูลอนุกรมเวลา

และแผนภูมินี้แสดงข้อมูลที่ไม่มีแนวโน้ม:

ตัวอย่างข้อมูลอนุกรมเวลาที่ไม่มีแนวโน้ม

สังเกตว่าการดูแนวโน้มตามฤดูกาลในข้อมูลอนุกรมเวลาในแผนภูมินี้ทำได้ง่ายกว่ามากเพียงใด เนื่องจากแนวโน้มขาขึ้นโดยรวมถูกลบออกแล้ว

วิธีที่ 2: การย่อยสลายโดยการปรับแบบจำลอง

อีกวิธีหนึ่งในการลดแนวโน้มข้อมูลอนุกรมเวลาคือการปรับแบบจำลองการถดถอยให้พอดีกับข้อมูล จากนั้นจึงคำนวณความแตกต่างระหว่างค่าที่สังเกตได้กับค่าที่คาดการณ์ของแบบจำลอง

ตัวอย่างเช่น สมมติว่าเรามีชุดข้อมูลเดียวกัน:

หากเราใส่ แบบจำลองการถดถอยเชิงเส้นอย่างง่าย เข้ากับข้อมูล เราจะได้ค่าที่คาดการณ์ไว้สำหรับ การสังเกต แต่ละครั้งในชุดข้อมูล

จากนั้นเราจะสามารถค้นหาความแตกต่างระหว่างค่าจริงและค่าที่คาดการณ์ไว้สำหรับการสังเกตแต่ละครั้ง ความแตกต่างเหล่านี้แสดงถึงข้อมูลที่ไม่มีแนวโน้ม

ข้อมูล detrending โดยการปรับแบบจำลอง

หากเราสร้างกราฟของข้อมูลโดยไม่มีแนวโน้ม เราจะเห็นภาพแนวโน้มตามฤดูกาลหรือวัฏจักรของข้อมูลได้ง่ายขึ้นมาก:

โปรดทราบว่าเราใช้การถดถอยเชิงเส้นในตัวอย่างนี้ แต่เป็นไปได้ที่จะใช้วิธีการที่ซับซ้อนกว่า เช่น การถดถอยเอ็กซ์โปเนนเชียล หากข้อมูลมีแนวโน้มขึ้นหรือลงแบบเอ็กซ์โปเนนเชียลมากกว่า

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *