วิธีใช้กฎง่ายๆ ใน r
กฎทั่วไป ซึ่งบางครั้งเรียกว่ากฎ 68-95-99.7 ระบุว่าสำหรับชุดข้อมูลที่กำหนดด้วยการแจกแจงแบบปกติ:
- 68% ของค่าข้อมูลอยู่ภายในค่าเบี่ยงเบนมาตรฐานหนึ่งของค่าเฉลี่ย
- 95% ของค่าข้อมูลอยู่ภายในค่าเบี่ยงเบนมาตรฐานสองค่าของค่าเฉลี่ย
- 99.7% ของค่าข้อมูลอยู่ภายในค่าเบี่ยงเบนมาตรฐานสามค่าของค่าเฉลี่ย
ในบทช่วยสอนนี้ เราจะอธิบายวิธีใช้หลักปฏิบัติใน R กับชุดข้อมูลที่กำหนด
การใช้กฎทั่วไปใน R
ฟังก์ชัน pnorm() ใน R ส่งกลับค่าของฟังก์ชันความหนาแน่นสะสมของการแจกแจงแบบปกติ
ฟังก์ชันนี้ใช้ไวยากรณ์พื้นฐานต่อไปนี้:
pnorm(q, ค่าเฉลี่ย, sd)
ทอง:
- q : ค่าตัวแปรสุ่มแบบกระจายตามปกติ
- ความหมาย : การกระจายเฉลี่ย
- sd : ค่าเบี่ยงเบนมาตรฐานของการแจกแจง
เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อค้นหาพื้นที่ใต้เส้นโค้งการแจกแจงแบบปกติที่อยู่ระหว่างค่าเบี่ยงเบนมาตรฐานต่างๆ:
#find area under normal curve within 1 standard deviation of mean pnorm(1) - pnorm(-1) [1] 0.6826895 #find area under normal curve within 2 standard deviations of mean pnorm(2) - pnorm(-2) [1] 0.9544997 #find area under normal curve within 3 standard deviations of mean pnorm(3) - pnorm(-3) [1] 0.9973002
จากผลลัพธ์เราสามารถยืนยันได้:
- 68% ของค่าข้อมูลอยู่ภายในค่าเบี่ยงเบนมาตรฐานหนึ่งของค่าเฉลี่ย
- 95% ของค่าข้อมูลอยู่ภายในค่าเบี่ยงเบนมาตรฐานสองค่าของค่าเฉลี่ย
- 99.7% ของค่าข้อมูลอยู่ภายในค่าเบี่ยงเบนมาตรฐานสามค่าของค่าเฉลี่ย
ตัวอย่างต่อไปนี้แสดงวิธีใช้กฎทั่วไปกับชุดข้อมูลที่แตกต่างกันในทางปฏิบัติ
ตัวอย่างที่ 1: การใช้กฎเชิงประจักษ์กับชุดข้อมูลใน R
สมมติว่าเรามีชุดข้อมูลที่แจกแจงแบบปกติโดยมีค่าเฉลี่ย 7 และค่าเบี่ยงเบนมาตรฐาน 2.2
เราสามารถใช้โค้ดต่อไปนี้เพื่อกำหนดว่าค่าใดประกอบด้วยข้อมูล 68%, 95% และ 99.7%:
#define mean and standard deviation values mean=7 sd=2.2 #find which values contain 68% of data mean-2.2; mean+2.2 [1] 4.8 [1] 9.2 #find which values contain 95% of data mean-2*2.2; mean+2*2.2 [1] 2.6 [1] 11.4 #find which values contain 99.7% of data mean-3*2.2; mean+3*2.2 [1] 0.4 [1] 13.6
จากผลลัพธ์นี้เราจะเห็นได้ว่า:
- 68% ของข้อมูลอยู่ระหว่าง 4.8 ถึง 9.2
- 95% ของข้อมูลอยู่ระหว่าง 2.6 ถึง 11.4
- 99.7% ของข้อมูลอยู่ระหว่าง 0.4 ถึง 13.6
ตัวอย่างที่ 2: กำหนดเปอร์เซ็นต์ของข้อมูลที่อยู่ระหว่างค่าบางค่า
ลองนึกภาพเรามีชุดข้อมูลที่แจกแจงแบบปกติซึ่งมีค่าเฉลี่ย 100 และค่าเบี่ยงเบนมาตรฐานเป็น 5
สมมติว่าเราต้องการทราบว่าเปอร์เซ็นต์ของข้อมูลอยู่ระหว่างค่า 99 ถึง 105 ในการแจกแจงนี้
เราสามารถใช้ฟังก์ชัน pnorm( ) เพื่อค้นหาคำตอบได้:
#find area under normal curve between 99 and 105
pnorm(105, mean=100, sd=5) - pnorm(99, mean=100, sd=5)
[1] 0.4206045
เราพบว่าข้อมูล 42.06% อยู่ระหว่างค่า 99 ถึง 105 สำหรับการแจกแจงนี้
แหล่งข้อมูลเพิ่มเติม
วิธีการใช้กฎทั่วไปใน Excel
ปัญหาในการปฏิบัติตามกฎเกณฑ์
กฎของเครื่องคิดเลข Thumb