การกระจายความน่าจะเป็นแบบไม่ต่อเนื่อง
บทความนี้จะอธิบายว่าการแจกแจงความน่าจะเป็นแบบแยกส่วนในสถิติคืออะไร ดังนั้น คุณจะพบความหมายของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง ตัวอย่างของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง และการแจกแจงความน่าจะเป็นแบบแยกประเภทต่างๆ มีอะไรบ้าง
การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องคืออะไร?
การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง คือการแจกแจงที่กำหนดความน่าจะเป็นของ ตัวแปรสุ่มแบบไม่ต่อเนื่อง ดังนั้นการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องสามารถรับค่าจำนวนจำกัดเท่านั้น (โดยปกติจะเป็นจำนวนเต็ม)
ตัวอย่างเช่น การแจกแจงแบบทวินาม การแจกแจงแบบปัวซง และการแจกแจงแบบไฮเปอร์จีโอเมตริก เป็นการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง
ในการแจกแจงความน่าจะเป็นแบบแยกส่วน แต่ละค่าของตัวแปรแยกส่วนที่ใช้แทน (x i ) จะสัมพันธ์กับค่าความน่าจะเป็น (p i ) ที่มีค่าตั้งแต่ 0 ถึง 1 ดังนั้น ผลรวมของความน่าจะเป็นทั้งหมดในการแจกแจงแบบแยกส่วนจะให้ผลลัพธ์เป็น 1 .
ตัวอย่างของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง
ตอนนี้เรารู้คำจำกัดความของการแจกแจงความน่าจะเป็นแบบแยกส่วนแล้ว เราจะเห็นตัวอย่างการแจกแจงประเภทนี้หลายตัวอย่างเพื่อทำความเข้าใจแนวคิดนี้ให้ดียิ่งขึ้น
ตัวอย่างของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง:
- จำนวนครั้งที่ได้เลข 5 จากการทอยลูกเต๋า 30 ครั้ง
- จำนวนผู้ใช้ที่เข้าถึงหน้าเว็บในหนึ่งวัน
- จำนวนนักเรียนที่สอบผ่านจากทั้งหมด 50 คน
- จำนวนหน่วยที่ชำรุดในตัวอย่างสินค้า 100 รายการ
- จำนวนครั้งที่บุคคลต้องทำการทดสอบขับรถจึงจะผ่าน
ประเภทของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง
การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องประเภท หลักๆ ได้แก่:
- การกระจายเครื่องแบบไม่ต่อเนื่อง
- การกระจายเบอร์นูลลี
- การแจกแจงแบบทวินาม
- การกระจายพันธุ์ปลา
- การกระจายพหุนาม
- การกระจายตัวทางเรขาคณิต
- การแจกแจงแบบทวินามลบ
- การกระจายตัวแบบไฮเปอร์เรขาคณิต
การแจกแจงความน่าจะเป็นแบบแยกแต่ละประเภทมีรายละเอียดอธิบายไว้ด้านล่าง
การกระจายเครื่องแบบไม่ต่อเนื่อง
การแจกแจงแบบสม่ำเสมอแบบ ไม่ต่อเนื่องคือการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง โดยค่าทั้งหมดมีความน่าจะเป็นที่เท่ากัน กล่าวคือ ในการแจกแจงแบบสม่ำเสมอแบบไม่ต่อเนื่อง ค่าทั้งหมดมีความน่าจะเป็นที่จะเกิดขึ้นเท่ากัน
ตัวอย่างเช่น การทอยลูกเต๋าสามารถกำหนดได้ด้วยการกระจายแบบสม่ำเสมอแบบไม่ต่อเนื่อง เนื่องจากผลลัพธ์ที่เป็นไปได้ทั้งหมด (1, 2, 3, 4, 5 หรือ 6) มีความน่าจะเป็นที่จะเกิดขึ้นเท่ากัน
โดยทั่วไปการแจกแจงแบบสม่ำเสมอแบบไม่ต่อเนื่องจะมีพารามิเตอร์ลักษณะเฉพาะสองตัว คือ a และ b ซึ่งกำหนดช่วงของค่าที่เป็นไปได้ที่การแจกแจงสามารถทำได้ ดังนั้น เมื่อตัวแปรถูกกำหนดโดยการแจกแจงแบบแยกส่วน ตัวแปรนั้นจะถูกเขียนเป็น Uniform(a,b)
การแจกแจงแบบสม่ำเสมอแบบไม่ต่อเนื่องสามารถใช้เพื่ออธิบายการทดลองสุ่มได้ เพราะหากผลลัพธ์ทั้งหมดมีความน่าจะเป็นเท่ากัน แสดงว่าการทดลองนั้นเป็นแบบสุ่ม
การกระจายเบอร์นูลลี
การแจกแจงแบบแบร์นูลลี หรือที่เรียกว่า การแจกแจงแบบแบ่งขั้ว เป็นการแจกแจงความน่าจะเป็นที่แสดงถึงตัวแปรแยกที่สามารถมีผลลัพธ์ได้เพียง 2 รายการเท่านั้น ได้แก่ “ความสำเร็จ” หรือ “ความล้มเหลว”
ในการแจกแจงแบบแบร์นูลลี “ความสำเร็จ” คือผลลัพธ์ที่เราคาดหวังและมีค่าเท่ากับ 1 ในขณะที่ผลลัพธ์ของ “ความล้มเหลว” คือผลลัพธ์อื่นนอกเหนือจากที่คาดหวังไว้และมีค่าเป็น 0 ดังนั้น หากความน่าจะเป็นของผลลัพธ์ของ “ ความสำเร็จ” คือ p ความน่าจะเป็นของผลลัพธ์ของ “ความล้มเหลว” คือ q=1-p
การแจกแจงแบบเบอร์นูลลีตั้งชื่อตามนักสถิติชาวสวิส เจค็อบ เบอร์นูลลี
ในทางสถิติ การแจกแจงแบบแบร์นูลลีส่วนใหญ่มีการใช้งานเพียงอย่างเดียว นั่นคือ การกำหนดความน่าจะเป็นของการทดลองซึ่งมีผลลัพธ์ที่เป็นไปได้เพียงสองอย่างเท่านั้น: สำเร็จและล้มเหลว ดังนั้น การทดลองที่ใช้การแจกแจงแบบแบร์นูลลีจึงเรียกว่าการทดสอบแบบเบอร์นูลลี หรือการทดลองแบบเบอร์นูลลี
การแจกแจงแบบทวินาม
การแจกแจงแบบทวินาม หรือที่เรียกว่า การแจกแจงแบบทวินาม เป็นการแจกแจงความน่าจะเป็นที่นับจำนวนความสำเร็จเมื่อทำการทดลองแบบแบ่งขั้วอิสระชุดหนึ่งโดยมีความน่าจะเป็นที่จะสำเร็จคงที่ กล่าวอีกนัยหนึ่ง การแจกแจงแบบทวินามคือการแจกแจงที่อธิบายจำนวนผลลัพธ์ที่สำเร็จของลำดับการทดลองเบอร์นูลลี
ตัวอย่างเช่น จำนวนครั้งที่เหรียญขึ้นหัว 25 ครั้ง เป็นการแจกแจงแบบทวินาม
โดยทั่วไป จำนวนการทดลองทั้งหมดที่ดำเนินการจะถูกกำหนดด้วยพารามิเตอร์ n ในขณะที่ p คือความน่าจะเป็นของความสำเร็จของการทดสอบแต่ละครั้ง ดังนั้นตัวแปรสุ่มที่ตามหลังการแจกแจงแบบทวินามจึงเขียนได้ดังนี้
โปรดทราบว่าในการแจกแจงแบบทวินาม การทดลองเดียวกันนั้นซ้ำกัน n ครั้ง และการทดลองนั้นเป็นอิสระจากกัน ดังนั้นความน่าจะเป็นที่จะสำเร็จของการทดลองแต่ละครั้งจึงเท่ากัน (p)
การกระจายพันธุ์ปลา
การแจกแจงแบบปัวซอง เป็นการแจกแจงความน่าจะเป็นที่กำหนดความน่าจะเป็นของเหตุการณ์จำนวนหนึ่งที่เกิดขึ้นในช่วงเวลาหนึ่ง กล่าวอีกนัยหนึ่ง การแจกแจงปัวซองใช้เพื่อสร้างแบบจำลองตัวแปรสุ่มที่อธิบายจำนวนครั้งที่ปรากฏการณ์เกิดซ้ำในช่วงเวลาหนึ่ง
ตัวอย่างเช่น จำนวนการโทรที่การแลกเปลี่ยนโทรศัพท์ได้รับต่อนาทีเป็นตัวแปรสุ่มแบบไม่ต่อเนื่องที่สามารถกำหนดได้โดยใช้การกระจายแบบปัวซอง
การแจกแจงแบบปัวซองมีพารามิเตอร์ลักษณะเฉพาะ แสดงด้วยตัวอักษรกรีก แล และระบุจำนวนครั้งที่เหตุการณ์ที่ศึกษาคาดว่าจะเกิดขึ้นในช่วงเวลาที่กำหนด
การกระจายพหุนาม
การแจกแจงแบบพหุนาม (หรือ การแจกแจงแบบพหุนาม ) เป็นการแจกแจงความน่าจะเป็นที่อธิบายความน่าจะเป็นของเหตุการณ์ที่ไม่เกิดร่วมกันหลายเหตุการณ์ที่เกิดขึ้นตามจำนวนครั้งที่กำหนดหลังการทดลองหลายครั้ง
นั่นคือ ถ้าการทดลองสุ่มสามารถส่งผลให้เกิดเหตุการณ์พิเศษสามเหตุการณ์ขึ้นไป และทราบความน่าจะเป็นของแต่ละเหตุการณ์ที่เกิดขึ้นแยกกัน การแจกแจงแบบพหุนามจะใช้ในการคำนวณความน่าจะเป็นที่เมื่อมีการทดลองหลายครั้ง จะมีเหตุการณ์จำนวนหนึ่งเกิดขึ้น เวลาทุกครั้ง
การแจกแจงแบบพหุนามจึงเป็นลักษณะทั่วไปของการแจกแจงแบบทวินาม
การกระจายตัวทางเรขาคณิต
การแจกแจงทางเรขาคณิต เป็นการแจกแจงความน่าจะเป็นที่กำหนดจำนวนการทดลองเบอร์นูลลีที่จำเป็นเพื่อให้ได้ผลลัพธ์สำเร็จในครั้งแรก นั่นคือกระบวนการแบบจำลองการกระจายทางเรขาคณิตซึ่งมีการทดลองเบอร์นูลลีซ้ำจนกระทั่งหนึ่งในนั้นได้รับผลลัพธ์ที่เป็นบวก
ตัวอย่างเช่น จำนวนรถยนต์ที่วิ่งบนถนนจนเห็นรถสีเหลืองเป็นการกระจายทางเรขาคณิต
โปรดจำไว้ว่าการทดสอบเบอร์นูลลีเป็นการทดลองที่มีผลลัพธ์ที่เป็นไปได้สองแบบ: “ความสำเร็จ” และ “ความล้มเหลว” ดังนั้นหากความน่าจะเป็นของ “ความสำเร็จ” คือ p ความน่าจะเป็นของ “ความล้มเหลว” ก็คือ q=1-p
การกระจายตัวทางเรขาคณิตจึงขึ้นอยู่กับพารามิเตอร์ p ซึ่งเป็นความน่าจะเป็นของความสำเร็จของการทดลองทั้งหมดที่ดำเนินการ นอกจากนี้ ความน่าจะเป็น p จะเท่ากันสำหรับการทดลองทั้งหมด
การแจกแจงแบบทวินามลบ
การแจกแจงแบบทวินามที่เป็นลบ คือการแจกแจงความน่าจะเป็นที่อธิบายจำนวนการทดลองเบอร์นูลลีที่จำเป็นเพื่อให้ได้ผลลัพธ์ที่เป็นบวกตามจำนวนที่กำหนด
ดังนั้น การแจกแจงแบบทวินามที่เป็นลบจึงมีพารามิเตอร์ลักษณะเฉพาะ 2 ตัว ได้แก่ r คือจำนวนผลลัพธ์ที่ต้องการ และ p คือความน่าจะเป็นที่จะประสบความสำเร็จสำหรับการทดลองเบอร์นูลลีแต่ละครั้ง
ดังนั้น การแจกแจงแบบทวินามที่เป็นลบจะกำหนดกระบวนการที่ดำเนินการทดลองเบอร์นูลลีหลายครั้งเท่าที่จำเป็นเพื่อให้ได้ ผลลัพธ์ ที่เป็นบวก นอกจากนี้ การทดลองของ Bernoulli ทั้งหมดนี้มีความเป็นอิสระและมีความน่าจะเป็นที่จะ ประสบความสำเร็จ อย่างต่อเนื่อง
ตัวอย่างเช่น ตัวแปรสุ่มที่ตามหลังการแจกแจงแบบทวินามที่เป็นลบคือจำนวนครั้งที่ต้องทอยลูกเต๋าจนกระทั่งทอยเลข 6 สามครั้ง
การกระจายตัวแบบไฮเปอร์เรขาคณิต
การแจกแจงแบบไฮเปอร์เรขาคณิต คือการแจกแจงความน่าจะเป็นที่อธิบายจำนวนกรณีที่ประสบความสำเร็จในการสุ่มตัวอย่างโดยไม่ต้องแทนที่องค์ประกอบ n รายการจากประชากร
นั่นคือ การแจกแจงแบบไฮเปอร์เรขาคณิตใช้ในการคำนวณความน่าจะเป็นที่จะได้ x สำเร็จเมื่อแยกองค์ประกอบ n รายการออกจากประชากรโดยไม่ต้องแทนที่องค์ประกอบใดเลย
ดังนั้นการแจกแจงแบบไฮเปอร์เรขาคณิตจึงมีพารามิเตอร์สามตัว:
- N : คือจำนวนองค์ประกอบในประชากร (N = 0, 1, 2,…)
- K : คือจำนวนกรณีความสำเร็จสูงสุด (K = 0, 1, 2,…,N) เนื่องจากในการกระจายแบบไฮเปอร์เรขาคณิต องค์ประกอบสามารถพิจารณาได้ว่าเป็น “ความสำเร็จ” หรือ “ความล้มเหลว” เท่านั้น NK จึงเป็นจำนวนกรณีความล้มเหลวสูงสุด
- n : คือจำนวนการดึงข้อมูลที่ไม่มีการแทนที่ที่ดำเนินการ
การกระจายความน่าจะเป็นแบบไม่ต่อเนื่องและต่อเนื่อง
สุดท้ายนี้ เราจะเห็นความแตกต่างระหว่างการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องและการแจกแจงความน่าจะเป็นแบบต่อเนื่อง เนื่องจากสิ่งสำคัญคือต้องรู้วิธีแยกแยะการแจกแจงทั้งสองประเภทนี้
ความแตกต่างระหว่างการแจกแจงแบบแยกและการแจกแจงแบบต่อเนื่อง คือจำนวนค่าที่สามารถรับได้ การแจกแจงแบบต่อเนื่องสามารถรับค่าใดๆ ก็ได้ ในทางกลับกัน การแจกแจงแบบแยกไม่ยอมรับค่าใดๆ แต่สามารถรับค่าได้เพียงจำนวนจำกัดเท่านั้น
วิธีหนึ่งในการแยกแยะการแจกแจงต่อเนื่องจากการแจกแจงแบบแยกคือการกำหนดประเภทของตัวเลขที่สามารถประกอบด้วยได้ โดยปกติ การแจกแจงแบบต่อเนื่องสามารถรับค่าใดๆ ก็ได้ รวมถึงเลขฐานสิบด้วย ในขณะที่การแจกแจงแบบแยกสามารถรับได้เฉพาะจำนวนเต็มเท่านั้น โปรดทราบว่าเคล็ดลับนี้ใช้ไม่ได้ในทุกกรณี แต่ในกรณีส่วนใหญ่