วิธีใช้แปลง qq เพื่อตรวจสอบภาวะปกติ
พล็อต QQ ย่อมาจาก “ควอนไทล์-ควอนไทล์” ใช้เพื่อประเมินว่าชุดข้อมูลอาจมาจากการแจกแจงทางทฤษฎีหรือไม่
ในกรณีส่วนใหญ่ การลงจุดประเภทนี้ใช้เพื่อพิจารณาว่าชุดข้อมูลเป็นไปตามการแจกแจงแบบปกติหรือไม่
หากข้อมูลมีการกระจายตามปกติ จุดบนพล็อต QQ จะอยู่บนเส้นทแยงมุม
ในทางกลับกัน ยิ่งจุดบนกราฟเบี่ยงเบนไปจากเส้นทแยงมุมที่มีนัยสำคัญมากเท่าใด ชุดข้อมูลก็จะเป็นไปตามการแจกแจงแบบปกติก็จะน้อยลงเท่านั้น
ตัวอย่างต่อไปนี้แสดงวิธีสร้างพล็อต QQ ใน R เพื่อตรวจสอบภาวะปกติ
ตัวอย่างที่ 1: พล็อต QQ สำหรับข้อมูลปกติ
รหัสต่อไปนี้แสดงวิธีสร้างชุดข้อมูลที่กระจายแบบปกติด้วย การสังเกต 200 ครั้ง และสร้างพล็อต QQ สำหรับชุดข้อมูลใน R:
#make this example reproducible set. seeds (1) #create some fake data that follows a normal distribution data <- rnorm(200) #create QQ plot qqnorm(data) qqline(data)

เราจะเห็นได้ว่าจุดต่างๆ มักจะอยู่ตามแนวเส้นทแยงมุมตรงโดยมีการเบี่ยงเบนเล็กน้อยตามหางแต่ละข้าง
จากกราฟนี้ เราสามารถสรุปได้อย่างปลอดภัยว่าชุดข้อมูลนี้มีการกระจายตามปกติ
ตัวอย่างที่ 2: พล็อต QQ สำหรับข้อมูลที่ไม่ปกติ
รหัสต่อไปนี้แสดงวิธีสร้างพล็อต QQ สำหรับชุดข้อมูลที่ตามหลังการแจกแจงแบบเอ็กซ์โปเนนเชียลด้วยการสังเกต 200 ครั้ง:
#make this example reproducible set. seeds (1) #create some fake data that follows an exponential distribution data <- rexp(200, rate=3) #create QQ plot qqnorm(data) qqline(data)

เราเห็นว่าจุดเบี่ยงเบนไปจากเส้นทแยงมุมมาก สิ่งนี้แสดงให้เห็นอย่างชัดเจนว่าชุดข้อมูลไม่ได้กระจายตามปกติ
สิ่งนี้น่าจะสมเหตุสมผลเนื่องจากเราระบุว่าข้อมูลควรเป็นไปตามการแจกแจงแบบเอ็กซ์โพเนนเชียล
พล็อต QQ และฮิสโตแกรม
ควรสังเกตว่าพล็อต QQ เป็นวิธีการตรวจสอบ ด้วยสายตา ว่าชุดข้อมูลเป็นไปตามการแจกแจงแบบปกติหรือไม่
อีกวิธีหนึ่งในการตรวจสอบภาวะปกติด้วยสายตาคือการสร้างฮิสโตแกรมของชุดข้อมูล หากข้อมูลเป็นไปตามรูปร่างเส้นโค้งระฆังในฮิสโตแกรมโดยประมาณ เราสามารถสรุปได้ว่าชุดข้อมูลนั้นมีการกระจายตามปกติ
ตัวอย่างเช่น ต่อไปนี้เป็นวิธีสร้างฮิสโตแกรมสำหรับชุดข้อมูลที่กระจายตามปกติก่อนหน้านี้:
#make this example reproducible set. seeds (1) #create some fake data that follows a normal distribution data <- rnorm(200) #create a histogram to visualize the distribution hist(data)

ต่อไปนี้คือวิธีสร้างฮิสโตแกรมสำหรับชุดข้อมูลที่ตามหลังการแจกแจงแบบเอ็กซ์โพเนนเชียลก่อนหน้า:
#make this example reproducible set. seeds (1) #create some fake data that follows an exponential distribution data <- rexp(200, rate=3) #create a histogram to visualize the distribution hist(data)

เราจะเห็นว่าฮิสโตแกรมดูไม่เหมือนเส้นโค้งระฆังเลย ซึ่งแสดงให้เห็นชัดเจนว่าข้อมูลไม่เป็นไปตามการแจกแจงแบบปกติ
แหล่งข้อมูลเพิ่มเติม
ข้อสันนิษฐานปกติในสถิติคืออะไร?
วิธีสร้างพล็อต QQ ใน R
วิธีสร้างพล็อต QQ ใน Excel
วิธีสร้างพล็อต QQ ใน Python