การแจกแจงแบบมีเงื่อนไขในสถิติคืออะไร?


ถ้า X และ Y เป็น ตัวแปรสุ่ม สองตัวที่กระจายร่วมกัน ดังนั้น การแจกแจงแบบมีเงื่อนไข ของ Y ที่กำหนด X คือการแจกแจงความน่าจะเป็นของ Y เมื่อรู้ว่า X เป็นค่าที่แน่นอน

ตัวอย่างเช่น ตารางสองทางต่อไปนี้แสดงผลการสำรวจที่ถามผู้คน 100 คนว่าพวกเขาชอบกีฬาประเภทใด: เบสบอล บาสเก็ตบอล หรือฟุตบอล

หากเราต้องการทราบความน่าจะเป็นที่บุคคลนั้นชอบกีฬาบางประเภท โดยพิจารณา ว่าเขาเป็นผู้ชาย นี่คือตัวอย่างของการแจกแจงแบบมีเงื่อนไข

ทราบค่าของตัวแปรสุ่มตัวหนึ่ง (บุคคลนั้นเป็นผู้ชาย) แต่ไม่ทราบค่าของตัวแปรสุ่มอีกตัวหนึ่ง (เราไม่รู้ว่ากีฬาโปรดของเขา)

หากต้องการค้นหาการกระจายแบบมีเงื่อนไขของการตั้งค่ากีฬาในหมู่ผู้ชาย เราจะดูค่าของเส้นสำหรับ ผู้ชาย ในตาราง:

ตัวอย่างการแจกแจงแบบมีเงื่อนไข

การแจกแจงแบบมีเงื่อนไขจะถูกคำนวณดังนี้:

  • ผู้ชายที่ชอบเล่นเบสบอล: 13/48 = 0.2708
  • ผู้ชายที่ชอบบาสเก็ตบอล: 15/48 = 0.3125
  • ผู้ชายที่ชอบฟุตบอล: 20/48 = 0.4167

โปรดทราบว่าผลรวมของความน่าจะเป็นคือ 1: 13/48 + 15/48 + 20/48 = 48/48 = 1

เราสามารถใช้การแจกแจงแบบมีเงื่อนไขนี้เพื่อตอบคำถามต่างๆ เช่น เมื่อพิจารณาว่าบุคคลนั้นเป็นผู้ชาย ความน่าจะเป็นที่เบสบอลเป็นกีฬาโปรดของเขาคือเท่าใด

จากการแจกแจงแบบมีเงื่อนไขที่เราคำนวณไว้ก่อนหน้านี้ จะเห็นว่าความน่าจะเป็นคือ 0.2708

ในทางเทคนิค เมื่อเราคำนวณการแจกแจงแบบมีเงื่อนไข เราจะบอกว่าเราสนใจ ประชากรย่อย เฉพาะของประชากรโดยรวม ประชากรย่อยในตัวอย่างก่อนหน้านี้ประกอบด้วยผู้ชาย:

ประชากรย่อยสำหรับการแจกแจงแบบมีเงื่อนไข

และเมื่อเราต้องการคำนวณความน่าจะเป็นที่เชื่อมโยงกับประชากรย่อยนี้ เราก็บอกว่าเราสนใจใน ลักษณะเฉพาะที่น่าสนใจ . ตัวละครที่น่าสนใจในตัวอย่างที่แล้วคือเบสบอล:

การกระจายแบบมีเงื่อนไขในสถิติ

ในการค้นหาความน่าจะเป็นที่คุณลักษณะที่น่าสนใจจะปรากฏในกลุ่มประชากรย่อย เราเพียงหารมูลค่าของคุณลักษณะที่น่าสนใจ (เช่น 13) ด้วยมูลค่ารวมของกลุ่มประชากรย่อย (เช่น 48) เพื่อให้ได้ 13/48 = 0.2708 .

การแจกแจงแบบมีเงื่อนไขและความเป็นอิสระ

เราสามารถพูดได้ว่าตัวแปรสุ่ม X และ Y มีความ เป็น อิสระก็ต่อเมื่อการแจกแจงแบบมีเงื่อนไขของ Y ที่กำหนด X นั้น เท่ากับการแจกแจงแบบไม่มีเงื่อนไขของ Y สำหรับการตระหนักรู้ที่เป็นไปได้ทั้งหมด

ตัวอย่างเช่น ในตารางก่อนหน้านี้ เราจะเห็นหรือไม่ว่าการทดสอบ “ชอบเบสบอล” และ “ชาย” มีความเป็นอิสระ

เพื่อตอบคำถามนี้ ลองคำนวณความน่าจะเป็นต่อไปนี้:

  • พี(ชอบเบสบอล)
  • P(ชอบเบสบอล | ผู้ชาย) “ชอบเบสบอลเนื่องจากเป็นผู้ชาย

ความน่าจะเป็นที่บุคคลหนึ่งชอบเล่นเบสบอลคือ:

  • P (ชอบเบสบอล) = 36/100 = 0.36

ความน่าจะเป็นที่บุคคลหนึ่งชอบเล่นเบสบอลโดยพิจารณาว่าเขาเป็นผู้ชายคือ

  • P (ชอบเบสบอล | ผู้ชาย) = 13/48 = .2708

เนื่องจาก P(ชอบเบสบอล) ไม่เท่ากับ P(ชอบเบสบอล | ชาย) ตัวแปรสุ่มของการตั้งค่ากีฬาและเพศจึง ไม่เป็น อิสระ

เหตุใดจึงต้องใช้การแจกแจงแบบมีเงื่อนไข

การแจกแจงความน่าจะเป็นแบบมีเงื่อนไขมีประโยชน์เนื่องจากเรามักจะรวบรวมข้อมูลสำหรับตัวแปรสองตัว (เช่น เพศและความชอบด้านกีฬา) แต่เราต้องการตอบคำถามเกี่ยวกับความน่าจะเป็นเมื่อเรา ทราบ ค่าของตัวแปรตัวใดตัวหนึ่ง

ในตัวอย่างก่อนหน้านี้ เราพิจารณาสถานการณ์สมมติที่เรารู้ว่าบุคคลหนึ่งๆ เป็นผู้ชาย และเราเพียงต้องการทราบความน่าจะเป็นที่บุคคลนี้จะชอบเบสบอล

มีหลายกรณีในชีวิตจริงที่เราทราบค่าของตัวแปรและสามารถใช้การแจกแจงแบบมีเงื่อนไขเพื่อค้นหาความน่าจะเป็นที่ตัวแปรอื่นจะมีค่าที่แน่นอน

แหล่งข้อมูลเพิ่มเติม

การกระจายส่วนเพิ่มคืออะไร?
การแจกแจงความน่าจะเป็นร่วมคืออะไร?
วิธีค้นหาความถี่สัมพัทธ์แบบมีเงื่อนไขในตารางรายการคู่

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *