วิธีใช้กฎง่ายๆ ใน r


กฎทั่วไป ซึ่งบางครั้งเรียกว่ากฎ 68-95-99.7 ระบุว่าสำหรับชุดข้อมูลที่กำหนดด้วยการแจกแจงแบบปกติ:

  • 68% ของค่าข้อมูลอยู่ภายในค่าเบี่ยงเบนมาตรฐานหนึ่งของค่าเฉลี่ย
  • 95% ของค่าข้อมูลอยู่ภายในค่าเบี่ยงเบนมาตรฐานสองค่าของค่าเฉลี่ย
  • 99.7% ของค่าข้อมูลอยู่ภายในค่าเบี่ยงเบนมาตรฐานสามค่าของค่าเฉลี่ย

ในบทช่วยสอนนี้ เราจะอธิบายวิธีใช้หลักปฏิบัติใน R กับชุดข้อมูลที่กำหนด

การใช้กฎทั่วไปใน R

ฟังก์ชัน pnorm() ใน R ส่งกลับค่าของฟังก์ชันความหนาแน่นสะสมของการแจกแจงแบบปกติ

ฟังก์ชันนี้ใช้ไวยากรณ์พื้นฐานต่อไปนี้:

pnorm(q, ค่าเฉลี่ย, sd)

ทอง:

  • q : ค่าตัวแปรสุ่มแบบกระจายตามปกติ
  • ความหมาย : การกระจายเฉลี่ย
  • sd : ค่าเบี่ยงเบนมาตรฐานของการแจกแจง

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อค้นหาพื้นที่ใต้เส้นโค้งการแจกแจงแบบปกติที่อยู่ระหว่างค่าเบี่ยงเบนมาตรฐานต่างๆ:

 #find area under normal curve within 1 standard deviation of mean
pnorm(1) - pnorm(-1)

[1] 0.6826895

#find area under normal curve within 2 standard deviations of mean 
pnorm(2) - pnorm(-2)

[1] 0.9544997

#find area under normal curve within 3 standard deviations of mean 
pnorm(3) - pnorm(-3)

[1] 0.9973002

จากผลลัพธ์เราสามารถยืนยันได้:

  • 68% ของค่าข้อมูลอยู่ภายในค่าเบี่ยงเบนมาตรฐานหนึ่งของค่าเฉลี่ย
  • 95% ของค่าข้อมูลอยู่ภายในค่าเบี่ยงเบนมาตรฐานสองค่าของค่าเฉลี่ย
  • 99.7% ของค่าข้อมูลอยู่ภายในค่าเบี่ยงเบนมาตรฐานสามค่าของค่าเฉลี่ย

ตัวอย่างต่อไปนี้แสดงวิธีใช้กฎทั่วไปกับชุดข้อมูลที่แตกต่างกันในทางปฏิบัติ

ตัวอย่างที่ 1: การใช้กฎเชิงประจักษ์กับชุดข้อมูลใน R

สมมติว่าเรามีชุดข้อมูลที่แจกแจงแบบปกติโดยมีค่าเฉลี่ย 7 และค่าเบี่ยงเบนมาตรฐาน 2.2

เราสามารถใช้โค้ดต่อไปนี้เพื่อกำหนดว่าค่าใดประกอบด้วยข้อมูล 68%, 95% และ 99.7%:

 #define mean and standard deviation values
mean=7
sd=2.2

#find which values contain 68% of data
mean-2.2; mean+2.2

[1] 4.8
[1] 9.2

#find which values contain 95% of data
mean-2*2.2; mean+2*2.2

[1] 2.6
[1] 11.4

#find which values contain 99.7% of data
mean-3*2.2; mean+3*2.2

[1] 0.4
[1] 13.6

จากผลลัพธ์นี้เราจะเห็นได้ว่า:

  • 68% ของข้อมูลอยู่ระหว่าง 4.8 ถึง 9.2
  • 95% ของข้อมูลอยู่ระหว่าง 2.6 ถึง 11.4
  • 99.7% ของข้อมูลอยู่ระหว่าง 0.4 ถึง 13.6

ตัวอย่างที่ 2: กำหนดเปอร์เซ็นต์ของข้อมูลที่อยู่ระหว่างค่าบางค่า

ลองนึกภาพเรามีชุดข้อมูลที่แจกแจงแบบปกติซึ่งมีค่าเฉลี่ย 100 และค่าเบี่ยงเบนมาตรฐานเป็น 5

สมมติว่าเราต้องการทราบว่าเปอร์เซ็นต์ของข้อมูลอยู่ระหว่างค่า 99 ถึง 105 ในการแจกแจงนี้

เราสามารถใช้ฟังก์ชัน pnorm( ) เพื่อค้นหาคำตอบได้:

 #find area under normal curve between 99 and 105
pnorm(105, mean=100, sd=5) - pnorm(99, mean=100, sd=5)

[1] 0.4206045

เราพบว่าข้อมูล 42.06% อยู่ระหว่างค่า 99 ถึง 105 สำหรับการแจกแจงนี้

แหล่งข้อมูลเพิ่มเติม

วิธีการใช้กฎทั่วไปใน Excel
ปัญหาในการปฏิบัติตามกฎเกณฑ์
กฎของเครื่องคิดเลข Thumb

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *