ฟังก์ชันมวลความน่าจะเป็น (pmf) ในสถิติคืออะไร?
ฟังก์ชันมวลความน่าจะเป็น ซึ่งมักเรียกสั้น ๆ ว่า PMF บอกเราถึงความน่าจะเป็นที่ ตัวแปรสุ่มแบบไม่ ต่อเนื่องรับค่าที่แน่นอน
ตัวอย่างเช่น สมมติว่าเราทอยลูกเต๋าหนึ่งครั้ง ถ้าเราปล่อยให้ x แทนจำนวนที่ลูกเต๋าตกลงไป ความน่าจะเป็นที่ x จะเท่ากับค่าที่ต่างกันสามารถอธิบายได้ดังนี้:
- ป(X=1): 1/6
- ป(X=2): 1/6
- ป(X=3): 1/6
- ป(X=4): 1/6
- ป(X=5): 1/6
- ป(X=6): 1/6
มีโอกาสเท่ากันที่ลูกเต๋าจะตกที่หมายเลขใด ๆ ระหว่าง 1 ถึง 6
ต่อไปนี้คือวิธีที่เราจะเขียนความน่าจะเป็นเหล่านี้เป็นฟังก์ชันมวลของความน่าจะเป็น:
ด้านซ้ายของแผนภาพแสดงความน่าจะเป็นที่เกี่ยวข้องกับผลลัพธ์ทางด้านขวา:
คุณลักษณะของฟังก์ชันมวลของความน่าจะเป็นคือความน่าจะเป็นทั้งหมดจะต้องรวมกันเป็น 1 คุณจะสังเกตเห็นว่า PMF นี้เป็นไปตามเงื่อนไขนี้:
ผลรวมของความน่าจะเป็น = 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1
การสนับสนุน ฟังก์ชันมวลความน่าจะเป็นหมายถึงชุดของค่าที่ตัวแปรสุ่มแบบไม่ต่อเนื่องสามารถรับได้ ในตัวอย่างนี้ การสนับสนุนจะเป็น {1, 2, 3, 4, 5, 6} เนื่องจากค่าของ die สามารถใช้ค่าใดก็ได้เหล่านี้
นอกเหนือจากการสนับสนุน ค่า PMF จะเป็นศูนย์ ตัวอย่างเช่น ความน่าจะเป็นที่ลูกเต๋าตกลงที่ “0” หรือ “7” หรือ “8” จะเป็นศูนย์เนื่องจากไม่มีตัวเลขเหล่านี้รวมอยู่ในวงเล็บ
ฟังก์ชันมวลความน่าจะเป็นในทางปฏิบัติ
สองตัวอย่างที่พบบ่อยที่สุดของฟังก์ชันมวลความน่าจะเป็นในทางปฏิบัติเกี่ยวข้องกับ การแจกแจงแบบทวินาม และ การแจกแจงแบบปัวซง
การแจกแจงแบบทวินาม
หากตัวแปรสุ่ม X เป็นไปตามการแจกแจงแบบทวินาม ความน่าจะเป็นที่ X = k สำเร็จจะพบได้จากสูตรต่อไปนี้:
P(X=k) = n C k * p k * (1-p) nk
ทอง:
- n: จำนวนการทดลอง
- k: จำนวนความสำเร็จ
- p: ความน่าจะเป็นที่จะประสบความสำเร็จในการทดลองที่กำหนด
- n C k : จำนวนวิธีในการได้รับ k ความสำเร็จในการทดลอง n ครั้ง
เช่น สมมุติว่าเราโยนเหรียญ 3 ครั้ง เราสามารถใช้สูตรด้านบนเพื่อกำหนดความน่าจะเป็นที่จะได้หัว 0, 1, 2 และ 3 ในการทอยทั้ง 3 ครั้ง:
- P(X=0) = 3 C 0 * 0.5 0 * (1-0.5) 3-0 = 1 * 1 * (0.5) 3 = 0.125
- ป(X=1) = 3 ค 1 * 0.5 1 * (1-0.5) 3-1 = 1 * 1 * (0.5) 2 = 0.375
- P(X=2) = 3 C 2 * 0.5 2 * (1-0.5) 3-2 = 1 * 1 * (0.5) 1 = 0.375
- P(X=3) = 3 C 3 * 0.5 3 * (1-0.5) 3-3 = 1 * 1 * (0.5) 0 = 0.125
การกระจายพันธุ์ปลา
หากตัวแปรสุ่ม X ตามหลังการแจกแจงแบบปัวซอง ความน่าจะเป็นที่ความสำเร็จของ X = k สามารถหาได้จากสูตรต่อไปนี้:
P(X=k) = แลม บ์ * อี – แล / k!
ทอง:
- แล: จำนวนความสำเร็จโดยเฉลี่ยที่เกิดขึ้นในช่วงเวลาที่กำหนด
- k: จำนวนความสำเร็จ
- e: ค่าคงที่เท่ากับประมาณ 2.71828
ตัวอย่างเช่น สมมติว่าโรงพยาบาลแห่งใดแห่งหนึ่งมีการคลอดบุตรโดยเฉลี่ย 2 คนต่อชั่วโมง เราสามารถใช้สูตรด้านบนเพื่อกำหนดความน่าจะเป็นที่จะเกิด 0, 1, 2, 3 ครั้ง เป็นต้น ในชั่วโมงที่กำหนด:
- P(X=0) = 2 0 * อี – 2 / 0! = 0.1353
- P(X=1) = 2 1 * อี – 2 / 1! = 0.2707
- P(X=2) = 2 2 * อี – 2 / 2! = 0.2707
- P(X=3) = 2 3 * อี – 2 / 3! = 0.1805
ดู PMF
เรามักจะเห็นภาพฟังก์ชันมวลของความน่าจะเป็นด้วยกราฟแท่ง
ตัวอย่างเช่น แผนภูมิแท่งต่อไปนี้แสดงความน่าจะเป็นที่เกี่ยวข้องกับจำนวนการเกิดต่อชั่วโมงสำหรับการแจกแจงปัวซองที่อธิบายไว้ในตัวอย่างก่อนหน้านี้:
โปรดทราบว่าจำนวนการเกิดอาจขยายไปจนถึงอนันต์ แต่ความน่าจะเป็นจะมีน้อยมากหลังจากผ่านไป 10 ปี จนคุณไม่สามารถมองเห็นได้บนกราฟแท่งด้วยซ้ำ
คุณสมบัติของ PMF
ฟังก์ชันมวลความน่าจะเป็นมีคุณสมบัติดังต่อไปนี้:
1. ความน่าจะเป็นทั้งหมดเป็นบวกในแนวรับ ตัวอย่างเช่น ความน่าจะเป็นที่ลูกเต๋าจะตกลงระหว่าง 1 ถึง 6 นั้นเป็นค่าบวก ในขณะที่ความน่าจะเป็นของผลลัพธ์อื่นๆ ทั้งหมดจะเป็นศูนย์
2. ผลลัพธ์ทั้งหมดมีความน่าจะเป็นระหว่าง 0 ถึง 1 ตัวอย่างเช่น ความน่าจะเป็นที่ลูกเต๋าตกระหว่าง 1 ถึง 6 คือ 1/6 หรือ 0.1666666 สำหรับแต่ละผลลัพธ์
3. ผลรวมของความน่าจะเป็นทั้งหมดจะต้องเท่ากับ 1 ตัวอย่างเช่น ผลรวมของความน่าจะเป็นของการตายที่เลขหนึ่งคือ 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1 /6 = 1.
แหล่งข้อมูลเพิ่มเติม
ตัวแปรสุ่มคืออะไร?
CDF หรือ PDF: อะไรคือความแตกต่าง?
ความรู้เบื้องต้นเกี่ยวกับการแจกแจงแบบทวินาม
ความรู้เบื้องต้นเกี่ยวกับการกระจายปัวซอง