วิธีใช้แปลง qq เพื่อตรวจสอบภาวะปกติ


พล็อต QQ ย่อมาจาก “ควอนไทล์-ควอนไทล์” ใช้เพื่อประเมินว่าชุดข้อมูลอาจมาจากการแจกแจงทางทฤษฎีหรือไม่

ในกรณีส่วนใหญ่ การลงจุดประเภทนี้ใช้เพื่อพิจารณาว่าชุดข้อมูลเป็นไปตามการแจกแจงแบบปกติหรือไม่

หากข้อมูลมีการกระจายตามปกติ จุดบนพล็อต QQ จะอยู่บนเส้นทแยงมุม

ในทางกลับกัน ยิ่งจุดบนกราฟเบี่ยงเบนไปจากเส้นทแยงมุมที่มีนัยสำคัญมากเท่าใด ชุดข้อมูลก็จะเป็นไปตามการแจกแจงแบบปกติก็จะน้อยลงเท่านั้น

ตัวอย่างต่อไปนี้แสดงวิธีสร้างพล็อต QQ ใน R เพื่อตรวจสอบภาวะปกติ

ตัวอย่างที่ 1: พล็อต QQ สำหรับข้อมูลปกติ

รหัสต่อไปนี้แสดงวิธีสร้างชุดข้อมูลที่กระจายแบบปกติด้วย การสังเกต 200 ครั้ง และสร้างพล็อต QQ สำหรับชุดข้อมูลใน R:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows a normal distribution
data <- rnorm(200)

#create QQ plot
qqnorm(data)
qqline(data)

เราจะเห็นได้ว่าจุดต่างๆ มักจะอยู่ตามแนวเส้นทแยงมุมตรงโดยมีการเบี่ยงเบนเล็กน้อยตามหางแต่ละข้าง

จากกราฟนี้ เราสามารถสรุปได้อย่างปลอดภัยว่าชุดข้อมูลนี้มีการกระจายตามปกติ

ตัวอย่างที่ 2: พล็อต QQ สำหรับข้อมูลที่ไม่ปกติ

รหัสต่อไปนี้แสดงวิธีสร้างพล็อต QQ สำหรับชุดข้อมูลที่ตามหลังการแจกแจงแบบเอ็กซ์โปเนนเชียลด้วยการสังเกต 200 ครั้ง:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows an exponential distribution
data <- rexp(200, rate=3)

#create QQ plot
qqnorm(data)
qqline(data)

เราเห็นว่าจุดเบี่ยงเบนไปจากเส้นทแยงมุมมาก สิ่งนี้แสดงให้เห็นอย่างชัดเจนว่าชุดข้อมูลไม่ได้กระจายตามปกติ

สิ่งนี้น่าจะสมเหตุสมผลเนื่องจากเราระบุว่าข้อมูลควรเป็นไปตามการแจกแจงแบบเอ็กซ์โพเนนเชียล

พล็อต QQ และฮิสโตแกรม

ควรสังเกตว่าพล็อต QQ เป็นวิธีการตรวจสอบ ด้วยสายตา ว่าชุดข้อมูลเป็นไปตามการแจกแจงแบบปกติหรือไม่

อีกวิธีหนึ่งในการตรวจสอบภาวะปกติด้วยสายตาคือการสร้างฮิสโตแกรมของชุดข้อมูล หากข้อมูลเป็นไปตามรูปร่างเส้นโค้งระฆังในฮิสโตแกรมโดยประมาณ เราสามารถสรุปได้ว่าชุดข้อมูลนั้นมีการกระจายตามปกติ

ตัวอย่างเช่น ต่อไปนี้เป็นวิธีสร้างฮิสโตแกรมสำหรับชุดข้อมูลที่กระจายตามปกติก่อนหน้านี้:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows a normal distribution
data <- rnorm(200)

#create a histogram to visualize the distribution
hist(data) 

ต่อไปนี้คือวิธีสร้างฮิสโตแกรมสำหรับชุดข้อมูลที่ตามหลังการแจกแจงแบบเอ็กซ์โพเนนเชียลก่อนหน้า:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows an exponential distribution
data <- rexp(200, rate=3)

#create a histogram to visualize the distribution
hist(data) 

เราจะเห็นว่าฮิสโตแกรมดูไม่เหมือนเส้นโค้งระฆังเลย ซึ่งแสดงให้เห็นชัดเจนว่าข้อมูลไม่เป็นไปตามการแจกแจงแบบปกติ

แหล่งข้อมูลเพิ่มเติม

ข้อสันนิษฐานปกติในสถิติคืออะไร?
วิธีสร้างพล็อต QQ ใน R
วิธีสร้างพล็อต QQ ใน Excel
วิธีสร้างพล็อต QQ ใน Python

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *