ฟังก์ชันมวลความน่าจะเป็น (pmf) ในสถิติคืออะไร?


ฟังก์ชันมวลความน่าจะเป็น ซึ่งมักเรียกสั้น ๆ ว่า PMF บอกเราถึงความน่าจะเป็นที่ ตัวแปรสุ่มแบบไม่ ต่อเนื่องรับค่าที่แน่นอน

ตัวอย่างเช่น สมมติว่าเราทอยลูกเต๋าหนึ่งครั้ง ถ้าเราปล่อยให้ x แทนจำนวนที่ลูกเต๋าตกลงไป ความน่าจะเป็นที่ x จะเท่ากับค่าที่ต่างกันสามารถอธิบายได้ดังนี้:

  • ป(X=1): 1/6
  • ป(X=2): 1/6
  • ป(X=3): 1/6
  • ป(X=4): 1/6
  • ป(X=5): 1/6
  • ป(X=6): 1/6

มีโอกาสเท่ากันที่ลูกเต๋าจะตกที่หมายเลขใด ๆ ระหว่าง 1 ถึง 6

ต่อไปนี้คือวิธีที่เราจะเขียนความน่าจะเป็นเหล่านี้เป็นฟังก์ชันมวลของความน่าจะเป็น:

ตัวอย่างฟังก์ชันมวลความน่าจะเป็น

ด้านซ้ายของแผนภาพแสดงความน่าจะเป็นที่เกี่ยวข้องกับผลลัพธ์ทางด้านขวา:

ฟังก์ชันมวลความน่าจะเป็นในสถิติ

คุณลักษณะของฟังก์ชันมวลของความน่าจะเป็นคือความน่าจะเป็นทั้งหมดจะต้องรวมกันเป็น 1 คุณจะสังเกตเห็นว่า PMF นี้เป็นไปตามเงื่อนไขนี้:

ผลรวมของความน่าจะเป็น = 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1

การสนับสนุน ฟังก์ชันมวลความน่าจะเป็นหมายถึงชุดของค่าที่ตัวแปรสุ่มแบบไม่ต่อเนื่องสามารถรับได้ ในตัวอย่างนี้ การสนับสนุนจะเป็น {1, 2, 3, 4, 5, 6} เนื่องจากค่าของ die สามารถใช้ค่าใดก็ได้เหล่านี้

นอกเหนือจากการสนับสนุน ค่า PMF จะเป็นศูนย์ ตัวอย่างเช่น ความน่าจะเป็นที่ลูกเต๋าตกลงที่ “0” หรือ “7” หรือ “8” จะเป็นศูนย์เนื่องจากไม่มีตัวเลขเหล่านี้รวมอยู่ในวงเล็บ

ฟังก์ชันมวลความน่าจะเป็นในทางปฏิบัติ

สองตัวอย่างที่พบบ่อยที่สุดของฟังก์ชันมวลความน่าจะเป็นในทางปฏิบัติเกี่ยวข้องกับ การแจกแจงแบบทวินาม และ การแจกแจงแบบปัวซง

การแจกแจงแบบทวินาม

หากตัวแปรสุ่ม X เป็นไปตามการแจกแจงแบบทวินาม ความน่าจะเป็นที่ X = k สำเร็จจะพบได้จากสูตรต่อไปนี้:

P(X=k) = n C k * p k * (1-p) nk

ทอง:

  • n: จำนวนการทดลอง
  • k: จำนวนความสำเร็จ
  • p: ความน่าจะเป็นที่จะประสบความสำเร็จในการทดลองที่กำหนด
  • n C k : จำนวนวิธีในการได้รับ k ความสำเร็จในการทดลอง n ครั้ง

เช่น สมมุติว่าเราโยนเหรียญ 3 ครั้ง เราสามารถใช้สูตรด้านบนเพื่อกำหนดความน่าจะเป็นที่จะได้หัว 0, 1, 2 และ 3 ในการทอยทั้ง 3 ครั้ง:

  • P(X=0) = 3 C 0 * 0.5 0 * (1-0.5) 3-0 = 1 * 1 * (0.5) 3 = 0.125
  • ป(X=1) = 31 * 0.5 1 * (1-0.5) 3-1 = 1 * 1 * (0.5) 2 = 0.375
  • P(X=2) = 3 C 2 * 0.5 2 * (1-0.5) 3-2 = 1 * 1 * (0.5) 1 = 0.375
  • P(X=3) = 3 C 3 * 0.5 3 * (1-0.5) 3-3 = 1 * 1 * (0.5) 0 = 0.125

การกระจายพันธุ์ปลา

หากตัวแปรสุ่ม X ตามหลังการแจกแจงแบบปัวซอง ความน่าจะเป็นที่ความสำเร็จของ X = k สามารถหาได้จากสูตรต่อไปนี้:

P(X=k) = แลม บ์ * อี – แล / k!

ทอง:

  • แล: จำนวนความสำเร็จโดยเฉลี่ยที่เกิดขึ้นในช่วงเวลาที่กำหนด
  • k: จำนวนความสำเร็จ
  • e: ค่าคงที่เท่ากับประมาณ 2.71828

ตัวอย่างเช่น สมมติว่าโรงพยาบาลแห่งใดแห่งหนึ่งมีการคลอดบุตรโดยเฉลี่ย 2 คนต่อชั่วโมง เราสามารถใช้สูตรด้านบนเพื่อกำหนดความน่าจะเป็นที่จะเกิด 0, 1, 2, 3 ครั้ง เป็นต้น ในชั่วโมงที่กำหนด:

  • P(X=0) = 2 0 * อี – 2 / 0! = 0.1353
  • P(X=1) = 2 1 * อี – 2 / 1! = 0.2707
  • P(X=2) = 2 2 * อี – 2 / 2! = 0.2707
  • P(X=3) = 2 3 * อี – 2 / 3! = 0.1805

ดู PMF

เรามักจะเห็นภาพฟังก์ชันมวลของความน่าจะเป็นด้วยกราฟแท่ง

ตัวอย่างเช่น แผนภูมิแท่งต่อไปนี้แสดงความน่าจะเป็นที่เกี่ยวข้องกับจำนวนการเกิดต่อชั่วโมงสำหรับการแจกแจงปัวซองที่อธิบายไว้ในตัวอย่างก่อนหน้านี้:

วิธีเห็นภาพฟังก์ชันมวลความน่าจะเป็น

โปรดทราบว่าจำนวนการเกิดอาจขยายไปจนถึงอนันต์ แต่ความน่าจะเป็นจะมีน้อยมากหลังจากผ่านไป 10 ปี จนคุณไม่สามารถมองเห็นได้บนกราฟแท่งด้วยซ้ำ

คุณสมบัติของ PMF

ฟังก์ชันมวลความน่าจะเป็นมีคุณสมบัติดังต่อไปนี้:

1. ความน่าจะเป็นทั้งหมดเป็นบวกในแนวรับ ตัวอย่างเช่น ความน่าจะเป็นที่ลูกเต๋าจะตกลงระหว่าง 1 ถึง 6 นั้นเป็นค่าบวก ในขณะที่ความน่าจะเป็นของผลลัพธ์อื่นๆ ทั้งหมดจะเป็นศูนย์

2. ผลลัพธ์ทั้งหมดมีความน่าจะเป็นระหว่าง 0 ถึง 1 ตัวอย่างเช่น ความน่าจะเป็นที่ลูกเต๋าตกระหว่าง 1 ถึง 6 คือ 1/6 หรือ 0.1666666 สำหรับแต่ละผลลัพธ์

3. ผลรวมของความน่าจะเป็นทั้งหมดจะต้องเท่ากับ 1 ตัวอย่างเช่น ผลรวมของความน่าจะเป็นของการตายที่เลขหนึ่งคือ 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1 /6 = 1.

แหล่งข้อมูลเพิ่มเติม

ตัวแปรสุ่มคืออะไร?
CDF หรือ PDF: อะไรคือความแตกต่าง?
ความรู้เบื้องต้นเกี่ยวกับการแจกแจงแบบทวินาม
ความรู้เบื้องต้นเกี่ยวกับการกระจายปัวซอง

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *