วิธีการคำนวณพิสัยระหว่างควอไทล์ในหน่วย r (พร้อมตัวอย่าง)
ช่วงระหว่างควอร์ไทล์ แสดงถึงความแตกต่างระหว่างควอไทล์ที่หนึ่ง (เปอร์เซ็นไทล์ที่ 25) และควอไทล์ที่สาม (เปอร์เซ็นไทล์ที่ 75) ของชุดข้อมูล
พูดง่ายๆ ก็คือ วัดค่าเบี่ยงเบนระหว่างค่ากลาง 50%
ไอคิวอาร์ = ไตรมาส 3 – ไตรมาส 1
เราสามารถใช้ฟังก์ชัน IQR() ในตัวเพื่อคำนวณช่วงระหว่างควอไทล์ของชุดค่าใน R:
IQR(x)
ตัวอย่างต่อไปนี้แสดงวิธีใช้ฟังก์ชันนี้ในทางปฏิบัติ
ตัวอย่างที่ 1: พิสัยระหว่างควอไทล์ของเวกเตอร์
รหัสต่อไปนี้แสดงวิธีคำนวณช่วงระหว่างควอไทล์ของค่าในเวกเตอร์:
#definevector x <- c(4, 6, 6, 7, 8, 12, 15, 17, 20, 21, 21, 23, 24, 27, 28) #calculate interquartile range of values in vector IQR(x) [1] 14.5
ตัวอย่างที่ 2: พิสัยระหว่างควอไทล์ของเวกเตอร์ที่มีค่าหายไป
หากเวกเตอร์ของคุณมีค่าหายไป อย่าลืมระบุ na.rm=TRUE เพื่อละเว้นค่าที่หายไปเมื่อคำนวณช่วงระหว่างควอไทล์:
#define vector with some missing values x <- c(4, 6, NA, 7, NA, NA, 15, 17, 20, 21, 21, 23, 24, 27, 28) #calculate interquartile range of values in vector IQR(x, na. rm = TRUE ) [1] 10.25
ตัวอย่างที่ 3: ช่วงระหว่างควอไทล์ของคอลัมน์ในกรอบข้อมูล
รหัสต่อไปนี้แสดงวิธีการคำนวณช่วงระหว่างควอไทล์สำหรับคอลัมน์เฉพาะในกรอบข้อมูล:
#define data frame df <- data. frame (var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9)) #calculate interquartile range of 'var1' column IQR(df$var1) [1] 1
ตัวอย่างที่ 4: ช่วงระหว่างควอไทล์ของหลายคอลัมน์ในกรอบข้อมูล
รหัสต่อไปนี้แสดงวิธีการคำนวณช่วงระหว่างควอไทล์ของหลายคอลัมน์ในกรอบข้อมูล:
#define data frame df <- data. frame (var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9)) #calculate interquartile range of 'var1', 'var2', and 'var4' columns sapply(df[, c(' var1 ', ' var2 ', ' var4 ')], IQR) var1 var2 var4 1 4 7
แหล่งข้อมูลเพิ่มเติม
วิธีค้นหาช่วงใน R
วิธีการคำนวณค่าเบี่ยงเบนมาตรฐานใน R
วิธีการตีความพิสัยระหว่างควอไทล์
ช่วงระหว่างควอไทล์และส่วนเบี่ยงเบนมาตรฐาน: อะไรคือความแตกต่าง?