วิธีกำหนดย่อยตามช่วงวันที่ใน r (พร้อมตัวอย่าง)
วิธีที่ง่ายที่สุดในการกำหนดเฟรมข้อมูลย่อยตามช่วงวันที่ใน R คือการใช้ไวยากรณ์ต่อไปนี้:
df[df$date >= " some date " & df$date <= " some date ", ]
บทช่วยสอนนี้มีตัวอย่างการใช้งานฟังก์ชันนี้ในทางปฏิบัติหลายตัวอย่าง
ตัวอย่างที่ 1: เซตย่อยระหว่างวันที่สองวัน
รหัสต่อไปนี้แสดงวิธีการเลือกแถวในกรอบข้อมูลระหว่างวันที่รวมสองวัน:
#make this example reproducible set.seed(0) #create data frame df <- data.frame(date = as . Date (" 2021-01-01 ") - 0:19, sales = runif (20, 10, 500) + seq (50, 69)^2) #view first six rows head(df) dirty date 1 2021-01-01 2949,382 2 2020-12-31 2741.099 3 2020-12-30 2896.341 4 2020-12-29 3099.698 5 2020-12-28 3371.022 6 2020-12-27 3133.824 #subset between two dates, inclusive df[df$date >= " 2020-12-25 " & df$date <= " 2020-12-28 ", ] dirty dates 5 2020-12-28 3371.022 6 2020-12-27 3133.824 7 2020-12-26 3586.211 8 2020-12-25 3721.891
เพียงปรับเปลี่ยนเครื่องหมายบนและล่างเพื่อเลือกบรรทัดระหว่างวันที่พิเศษสองวัน:
#make this example reproducible set.seed(0) #create data frame df <- data.frame(date = as . Date (" 2021-01-01 ") - 0:19, sales = runif (20, 10, 500) + seq (50, 69)^2) #subset between two dates, exclusive df[df$date > " 2020-12-25 " & df$date < " 2020-12-28 ", ] dirty date 6 2020-12-27 3133.824 7 2020-12-26 3586.211
ตัวอย่างที่ 2: เซ็ตย่อยหลังจากวันที่กำหนด
รหัสต่อไปนี้แสดงวิธีการเลือกแถวในกรอบข้อมูลที่ปรากฏขึ้นหลังจากวันที่กำหนด:
#make this example reproducible set.seed(0) #create data frame df <- data.frame(date = as . Date (" 2021-01-01 ") - 0:19, sales = runif (20, 10, 500) + seq (50, 69)^2) #subset after a certain date df[df$date >= " 2020-12-22 ", ] dirty dates 1 2021-01-01 2949.382 2 2020-12-31 2741.099 3 2020-12-30 2896.341 4 2020-12-29 3099.698 5 2020-12-28 3371.022 6 2020-12-27 3133.824 7 2020-12-26 3586.211 8 2020-12-25 3721.891 9 2020-12-24 3697.791 10 2020-12-23 3799.266 11 2020-12-22 3640.275
ตัวอย่างที่ 3: เซตย่อยก่อนวันที่กำหนด
รหัสต่อไปนี้แสดงวิธีการเลือกแถวจากกรอบข้อมูลที่เกิดขึ้นก่อนวันที่กำหนด:
#make this example reproducible set.seed(0) #create data frame df <- data.frame(date = as . Date (" 2021-01-01 ") - 0:19, sales = runif (20, 10, 500) + seq (50, 69)^2) #subset before a certain date df[df$date < " 2020-12-22 ", ] dirty date 12 2020-12-21 3831.928 13 2020-12-20 3940.513 14 2020-12-19 4315.641 15 2020-12-18 4294.211 16 2020-12-17 4612.222 17 2020-12-16 4609.873 18 2020-12-15 4850.633 19 2020-12-14 5120.034 20 2020-12-13 4957.217
แหล่งข้อมูลเพิ่มเติม
วิธีการพล็อตอนุกรมเวลาใน R
วิธีแยกปีจากวันที่ใน R
วิธีรวบรวมข้อมูลรายวันเป็นข้อมูลรายเดือนและรายปีใน R