การแจกแจงความน่าจะเป็นร่วมคืออะไร?
ตารางความถี่แบบสองทาง คือตารางที่แสดงความถี่ (หรือ “จำนวน”) สำหรับตัวแปรประเภทสองตัว
ตัวอย่างเช่น ตารางสองทางต่อไปนี้แสดงผลการสำรวจที่ถามผู้คน 100 คนว่าพวกเขาชอบกีฬาประเภทใด: เบสบอล บาสเก็ตบอล หรือฟุตบอล
แถวแสดงเพศของผู้ตอบแบบสอบถาม และคอลัมน์ระบุกีฬาที่พวกเขาเลือก:

ในตัวอย่างนี้ มีตัวแปรสองตัว: กีฬาและเพศ
การแจกแจงความน่าจะเป็นแบบร่วม เพียงอธิบายถึงความน่าจะเป็นที่บุคคลที่กำหนดจะใช้ค่าเฉพาะสองค่าสำหรับตัวแปร
คำว่า “ร่วม” มาจากข้อเท็จจริงที่ว่าเราสนใจความน่าจะเป็นที่จะมีสองสิ่งเกิดขึ้นในเวลาเดียวกัน
ตัวอย่างเช่น จากทั้งหมด 100 คน มี 13 คนเป็นผู้ชาย และ เลือกเบสบอลเป็นกีฬาโปรดของพวกเขา
ดังนั้น เราจะบอกว่าความน่าจะเป็นร่วมที่บุคคลหนึ่งๆ เป็นผู้ชาย และ เลือกเบสบอลเป็นกีฬาโปรดคือ 13/100 = 0.13 หรือ 13%
เขียนด้วยสัญกรณ์ทางคณิตศาสตร์:
P(เพศ = ชาย กีฬา = เบสบอล) = 13/100 = 0.13
เราสามารถใช้กระบวนการนี้ในการคำนวณการแจกแจงความน่าจะเป็นร่วมทั้งหมด:
- P (เพศ = ชาย กีฬา = เบสบอล) = 13/100 = 0.13
- P(เพศ = ชาย กีฬา = บาสเก็ตบอล) = 15/100 = 0.15
- P(เพศ = ชาย กีฬา = ฟุตบอล) = 20/100 = 0.20
- P (เพศ = หญิง กีฬา = เบสบอล) = 23/100 = 0.23
- P(เพศ = หญิง กีฬา = บาสเก็ตบอล) = 16/100 = 0.16
- P(เพศ = หญิง กีฬา = ฟุตบอล) = 13/100 = 0.13
โปรดทราบว่าผลรวมของความน่าจะเป็นเท่ากับ 1 หรือ 100%
เหตุใดจึงต้องใช้การแจกแจงความน่าจะเป็นร่วม
การแจกแจงความน่าจะเป็นแบบร่วมมีประโยชน์เนื่องจากเรามักจะรวบรวมข้อมูลสำหรับตัวแปรสองตัว (เช่น กีฬาและเพศ) และต้องการตอบคำถามที่เกี่ยวข้องกับตัวแปร ทั้งสอง
ตัวอย่างเช่น เราอาจต้องการเข้าใจความน่าจะเป็นที่บุคคลใน กลุ่มประชากร เป็นผู้ชาย และ ชอบเบสบอลเป็นกีฬาโปรดของพวกเขา
หรือเราอาจสนใจที่จะทำความเข้าใจความน่าจะเป็นที่บุคคลหนึ่งๆ นั้นเป็นผู้หญิง และ ชอบฟุตบอลเป็นกีฬาโปรดของพวกเขา
การแจกแจงความน่าจะเป็นร่วมสามารถช่วยเราตอบคำถามเหล่านี้ได้
ใช้ตัวอย่างต่อไปนี้เป็นแนวทางปฏิบัติเพื่อทำความเข้าใจการแจกแจงความน่าจะเป็นร่วมให้ดียิ่งขึ้น
ตัวอย่างที่ 1
ตารางสองทางต่อไปนี้นำเสนอผลการสำรวจที่ถามผู้คน 238 คนว่าพวกเขาชอบภาพยนตร์ประเภทใด:

คำถาม: อะไรคือความน่าจะเป็นที่บุคคลหนึ่งๆ จะเป็นผู้หญิงและชอบแนวดราม่าเป็นแนวภาพยนตร์ที่เธอชื่นชอบ?
ตอบ P (เพศ = หญิง, เพศ = ละคร) = 58/238 = 0.244 = 24.4%
ตัวอย่างที่ 2
ตารางสองทางต่อไปนี้แสดงคะแนนสอบของนักเรียน 64 คนในชั้นเรียนโดยพิจารณาจากจำนวนชั่วโมงที่พวกเขาใช้เวลาเรียน:

คำถาม: ความน่าจะเป็นที่บุคคลหนึ่งเรียนเป็นเวลา 2 ชั่วโมงและได้รับเกรดระหว่าง 91 ถึง 100 เป็นเท่าใด
ตอบ P (เรียน = 2 ชั่วโมง คะแนน = 91-100) = 3/64 = 0.047 = 4.7%
แหล่งข้อมูลเพิ่มเติม
การกระจายส่วนเพิ่มคืออะไร?
วิธีค้นหาความถี่สัมพัทธ์แบบมีเงื่อนไขในตารางรายการคู่