การกระจายความน่าจะเป็นแบบไม่ต่อเนื่อง

บทความนี้จะอธิบายว่าการแจกแจงความน่าจะเป็นแบบแยกส่วนในสถิติคืออะไร ดังนั้น คุณจะพบความหมายของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง ตัวอย่างของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง และการแจกแจงความน่าจะเป็นแบบแยกประเภทต่างๆ มีอะไรบ้าง

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องคืออะไร?

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง คือการแจกแจงที่กำหนดความน่าจะเป็นของ ตัวแปรสุ่มแบบไม่ต่อเนื่อง ดังนั้นการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องสามารถรับค่าจำนวนจำกัดเท่านั้น (โดยปกติจะเป็นจำนวนเต็ม)

ตัวอย่างเช่น การแจกแจงแบบทวินาม การแจกแจงแบบปัวซง และการแจกแจงแบบไฮเปอร์จีโอเมตริก เป็นการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง

ในการแจกแจงความน่าจะเป็นแบบแยกส่วน แต่ละค่าของตัวแปรแยกส่วนที่ใช้แทน (x i ) จะสัมพันธ์กับค่าความน่าจะเป็น (p i ) ที่มีค่าตั้งแต่ 0 ถึง 1 ดังนั้น ผลรวมของความน่าจะเป็นทั้งหมดในการแจกแจงแบบแยกส่วนจะให้ผลลัพธ์เป็น 1 .

\begin{array}{c}P[X=x_i]=p_i \quad i=1,2,\ldots, n\\[2ex]0\leq p_i\leq 1\\[2ex]\displaystyle\sum_{i=0}^{n}p_i=1\end{array}

ตัวอย่างของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง

ตอนนี้เรารู้คำจำกัดความของการแจกแจงความน่าจะเป็นแบบแยกส่วนแล้ว เราจะเห็นตัวอย่างการแจกแจงประเภทนี้หลายตัวอย่างเพื่อทำความเข้าใจแนวคิดนี้ให้ดียิ่งขึ้น

ตัวอย่างของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง:

  1. จำนวนครั้งที่ได้เลข 5 จากการทอยลูกเต๋า 30 ครั้ง
  2. จำนวนผู้ใช้ที่เข้าถึงหน้าเว็บในหนึ่งวัน
  3. จำนวนนักเรียนที่สอบผ่านจากทั้งหมด 50 คน
  4. จำนวนหน่วยที่ชำรุดในตัวอย่างสินค้า 100 รายการ
  5. จำนวนครั้งที่บุคคลต้องทำการทดสอบขับรถจึงจะผ่าน

ประเภทของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องประเภท หลักๆ ได้แก่:

  • การกระจายเครื่องแบบไม่ต่อเนื่อง
  • การกระจายเบอร์นูลลี
  • การแจกแจงแบบทวินาม
  • การกระจายพันธุ์ปลา
  • การกระจายพหุนาม
  • การกระจายตัวทางเรขาคณิต
  • การแจกแจงแบบทวินามลบ
  • การกระจายตัวแบบไฮเปอร์เรขาคณิต

การแจกแจงความน่าจะเป็นแบบแยกแต่ละประเภทมีรายละเอียดอธิบายไว้ด้านล่าง

การกระจายเครื่องแบบไม่ต่อเนื่อง

การแจกแจงแบบสม่ำเสมอแบบ ไม่ต่อเนื่องคือการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง โดยค่าทั้งหมดมีความน่าจะเป็นที่เท่ากัน กล่าวคือ ในการแจกแจงแบบสม่ำเสมอแบบไม่ต่อเนื่อง ค่าทั้งหมดมีความน่าจะเป็นที่จะเกิดขึ้นเท่ากัน

ตัวอย่างเช่น การทอยลูกเต๋าสามารถกำหนดได้ด้วยการกระจายแบบสม่ำเสมอแบบไม่ต่อเนื่อง เนื่องจากผลลัพธ์ที่เป็นไปได้ทั้งหมด (1, 2, 3, 4, 5 หรือ 6) มีความน่าจะเป็นที่จะเกิดขึ้นเท่ากัน

โดยทั่วไปการแจกแจงแบบสม่ำเสมอแบบไม่ต่อเนื่องจะมีพารามิเตอร์ลักษณะเฉพาะสองตัว คือ a และ b ซึ่งกำหนดช่วงของค่าที่เป็นไปได้ที่การแจกแจงสามารถทำได้ ดังนั้น เมื่อตัวแปรถูกกำหนดโดยการแจกแจงแบบแยกส่วน ตัวแปรนั้นจะถูกเขียนเป็น Uniform(a,b)

X\sim \text{Uniforme}(a,b)

การแจกแจงแบบสม่ำเสมอแบบไม่ต่อเนื่องสามารถใช้เพื่ออธิบายการทดลองสุ่มได้ เพราะหากผลลัพธ์ทั้งหมดมีความน่าจะเป็นเท่ากัน แสดงว่าการทดลองนั้นเป็นแบบสุ่ม

การกระจายเบอร์นูลลี

การแจกแจงแบบแบร์นูลลี หรือที่เรียกว่า การแจกแจงแบบแบ่งขั้ว เป็นการแจกแจงความน่าจะเป็นที่แสดงถึงตัวแปรแยกที่สามารถมีผลลัพธ์ได้เพียง 2 รายการเท่านั้น ได้แก่ “ความสำเร็จ” หรือ “ความล้มเหลว”

ในการแจกแจงแบบแบร์นูลลี “ความสำเร็จ” คือผลลัพธ์ที่เราคาดหวังและมีค่าเท่ากับ 1 ในขณะที่ผลลัพธ์ของ “ความล้มเหลว” คือผลลัพธ์อื่นนอกเหนือจากที่คาดหวังไว้และมีค่าเป็น 0 ดังนั้น หากความน่าจะเป็นของผลลัพธ์ของ “ ความสำเร็จ” คือ p ความน่าจะเป็นของผลลัพธ์ของ “ความล้มเหลว” คือ q=1-p

\begin{array}{c}X\sim \text{Bernoulli}(p)\\[2ex]\begin{array}{l} \text{\'Exito}\ \color{orange}\bm{\longrightarrow}\color{black} \ P[X=1]=p\\[2ex]\text{Fracaso}\ \color{orange}\bm{\longrightarrow}\color{black} \ P[X=0]=q=1-p\end{array}\end{array}

การแจกแจงแบบเบอร์นูลลีตั้งชื่อตามนักสถิติชาวสวิส เจค็อบ เบอร์นูลลี

ในทางสถิติ การแจกแจงแบบแบร์นูลลีส่วนใหญ่มีการใช้งานเพียงอย่างเดียว นั่นคือ การกำหนดความน่าจะเป็นของการทดลองซึ่งมีผลลัพธ์ที่เป็นไปได้เพียงสองอย่างเท่านั้น: สำเร็จและล้มเหลว ดังนั้น การทดลองที่ใช้การแจกแจงแบบแบร์นูลลีจึงเรียกว่าการทดสอบแบบเบอร์นูลลี หรือการทดลองแบบเบอร์นูลลี

การแจกแจงแบบทวินาม

การแจกแจงแบบทวินาม หรือที่เรียกว่า การแจกแจงแบบทวินาม เป็นการแจกแจงความน่าจะเป็นที่นับจำนวนความสำเร็จเมื่อทำการทดลองแบบแบ่งขั้วอิสระชุดหนึ่งโดยมีความน่าจะเป็นที่จะสำเร็จคงที่ กล่าวอีกนัยหนึ่ง การแจกแจงแบบทวินามคือการแจกแจงที่อธิบายจำนวนผลลัพธ์ที่สำเร็จของลำดับการทดลองเบอร์นูลลี

ตัวอย่างเช่น จำนวนครั้งที่เหรียญขึ้นหัว 25 ครั้ง เป็นการแจกแจงแบบทวินาม

โดยทั่วไป จำนวนการทดลองทั้งหมดที่ดำเนินการจะถูกกำหนดด้วยพารามิเตอร์ n ในขณะที่ p คือความน่าจะเป็นของความสำเร็จของการทดสอบแต่ละครั้ง ดังนั้นตัวแปรสุ่มที่ตามหลังการแจกแจงแบบทวินามจึงเขียนได้ดังนี้

X\sim\text{Bin}(n,p)

โปรดทราบว่าในการแจกแจงแบบทวินาม การทดลองเดียวกันนั้นซ้ำกัน n ครั้ง และการทดลองนั้นเป็นอิสระจากกัน ดังนั้นความน่าจะเป็นที่จะสำเร็จของการทดลองแต่ละครั้งจึงเท่ากัน (p)

การกระจายพันธุ์ปลา

การแจกแจงแบบปัวซอง เป็นการแจกแจงความน่าจะเป็นที่กำหนดความน่าจะเป็นของเหตุการณ์จำนวนหนึ่งที่เกิดขึ้นในช่วงเวลาหนึ่ง กล่าวอีกนัยหนึ่ง การแจกแจงปัวซองใช้เพื่อสร้างแบบจำลองตัวแปรสุ่มที่อธิบายจำนวนครั้งที่ปรากฏการณ์เกิดซ้ำในช่วงเวลาหนึ่ง

ตัวอย่างเช่น จำนวนการโทรที่การแลกเปลี่ยนโทรศัพท์ได้รับต่อนาทีเป็นตัวแปรสุ่มแบบไม่ต่อเนื่องที่สามารถกำหนดได้โดยใช้การกระจายแบบปัวซอง

การแจกแจงแบบปัวซองมีพารามิเตอร์ลักษณะเฉพาะ แสดงด้วยตัวอักษรกรีก แล และระบุจำนวนครั้งที่เหตุการณ์ที่ศึกษาคาดว่าจะเกิดขึ้นในช่วงเวลาที่กำหนด

X\sim \text{Poisson}(\lambda)

การกระจายพหุนาม

การแจกแจงแบบพหุนาม (หรือ การแจกแจงแบบพหุนาม ) เป็นการแจกแจงความน่าจะเป็นที่อธิบายความน่าจะเป็นของเหตุการณ์ที่ไม่เกิดร่วมกันหลายเหตุการณ์ที่เกิดขึ้นตามจำนวนครั้งที่กำหนดหลังการทดลองหลายครั้ง

นั่นคือ ถ้าการทดลองสุ่มสามารถส่งผลให้เกิดเหตุการณ์พิเศษสามเหตุการณ์ขึ้นไป และทราบความน่าจะเป็นของแต่ละเหตุการณ์ที่เกิดขึ้นแยกกัน การแจกแจงแบบพหุนามจะใช้ในการคำนวณความน่าจะเป็นที่เมื่อมีการทดลองหลายครั้ง จะมีเหตุการณ์จำนวนหนึ่งเกิดขึ้น เวลาทุกครั้ง

การแจกแจงแบบพหุนามจึงเป็นลักษณะทั่วไปของการแจกแจงแบบทวินาม

การกระจายตัวทางเรขาคณิต

การแจกแจงทางเรขาคณิต เป็นการแจกแจงความน่าจะเป็นที่กำหนดจำนวนการทดลองเบอร์นูลลีที่จำเป็นเพื่อให้ได้ผลลัพธ์สำเร็จในครั้งแรก นั่นคือกระบวนการแบบจำลองการกระจายทางเรขาคณิตซึ่งมีการทดลองเบอร์นูลลีซ้ำจนกระทั่งหนึ่งในนั้นได้รับผลลัพธ์ที่เป็นบวก

ตัวอย่างเช่น จำนวนรถยนต์ที่วิ่งบนถนนจนเห็นรถสีเหลืองเป็นการกระจายทางเรขาคณิต

โปรดจำไว้ว่าการทดสอบเบอร์นูลลีเป็นการทดลองที่มีผลลัพธ์ที่เป็นไปได้สองแบบ: “ความสำเร็จ” และ “ความล้มเหลว” ดังนั้นหากความน่าจะเป็นของ “ความสำเร็จ” คือ p ความน่าจะเป็นของ “ความล้มเหลว” ก็คือ q=1-p

การกระจายตัวทางเรขาคณิตจึงขึ้นอยู่กับพารามิเตอร์ p ซึ่งเป็นความน่าจะเป็นของความสำเร็จของการทดลองทั้งหมดที่ดำเนินการ นอกจากนี้ ความน่าจะเป็น p จะเท่ากันสำหรับการทดลองทั้งหมด

X\sim\text{Geom\'etrica}(p)

การแจกแจงแบบทวินามลบ

การแจกแจงแบบทวินามที่เป็นลบ คือการแจกแจงความน่าจะเป็นที่อธิบายจำนวนการทดลองเบอร์นูลลีที่จำเป็นเพื่อให้ได้ผลลัพธ์ที่เป็นบวกตามจำนวนที่กำหนด

ดังนั้น การแจกแจงแบบทวินามที่เป็นลบจึงมีพารามิเตอร์ลักษณะเฉพาะ 2 ตัว ได้แก่ r คือจำนวนผลลัพธ์ที่ต้องการ และ p คือความน่าจะเป็นที่จะประสบความสำเร็จสำหรับการทดลองเบอร์นูลลีแต่ละครั้ง

X\sim \text{BN}(r,p)

ดังนั้น การแจกแจงแบบทวินามที่เป็นลบจะกำหนดกระบวนการที่ดำเนินการทดลองเบอร์นูลลีหลายครั้งเท่าที่จำเป็นเพื่อให้ได้ ผลลัพธ์ ที่เป็นบวก นอกจากนี้ การทดลองของ Bernoulli ทั้งหมดนี้มีความเป็นอิสระและมีความน่าจะเป็นที่จะ ประสบความสำเร็จ อย่างต่อเนื่อง

ตัวอย่างเช่น ตัวแปรสุ่มที่ตามหลังการแจกแจงแบบทวินามที่เป็นลบคือจำนวนครั้งที่ต้องทอยลูกเต๋าจนกระทั่งทอยเลข 6 สามครั้ง

การกระจายตัวแบบไฮเปอร์เรขาคณิต

การแจกแจงแบบไฮเปอร์เรขาคณิต คือการแจกแจงความน่าจะเป็นที่อธิบายจำนวนกรณีที่ประสบความสำเร็จในการสุ่มตัวอย่างโดยไม่ต้องแทนที่องค์ประกอบ n รายการจากประชากร

นั่นคือ การแจกแจงแบบไฮเปอร์เรขาคณิตใช้ในการคำนวณความน่าจะเป็นที่จะได้ x สำเร็จเมื่อแยกองค์ประกอบ n รายการออกจากประชากรโดยไม่ต้องแทนที่องค์ประกอบใดเลย

ดังนั้นการแจกแจงแบบไฮเปอร์เรขาคณิตจึงมีพารามิเตอร์สามตัว:

  • N : คือจำนวนองค์ประกอบในประชากร (N = 0, 1, 2,…)
  • K : คือจำนวนกรณีความสำเร็จสูงสุด (K = 0, 1, 2,…,N) เนื่องจากในการกระจายแบบไฮเปอร์เรขาคณิต องค์ประกอบสามารถพิจารณาได้ว่าเป็น “ความสำเร็จ” หรือ “ความล้มเหลว” เท่านั้น NK จึงเป็นจำนวนกรณีความล้มเหลวสูงสุด
  • n : คือจำนวนการดึงข้อมูลที่ไม่มีการแทนที่ที่ดำเนินการ

X \sim HG(N,K,n)

การกระจายความน่าจะเป็นแบบไม่ต่อเนื่องและต่อเนื่อง

สุดท้ายนี้ เราจะเห็นความแตกต่างระหว่างการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องและการแจกแจงความน่าจะเป็นแบบต่อเนื่อง เนื่องจากสิ่งสำคัญคือต้องรู้วิธีแยกแยะการแจกแจงทั้งสองประเภทนี้

ความแตกต่างระหว่างการแจกแจงแบบแยกและการแจกแจงแบบต่อเนื่อง คือจำนวนค่าที่สามารถรับได้ การแจกแจงแบบต่อเนื่องสามารถรับค่าใดๆ ก็ได้ ในทางกลับกัน การแจกแจงแบบแยกไม่ยอมรับค่าใดๆ แต่สามารถรับค่าได้เพียงจำนวนจำกัดเท่านั้น

วิธีหนึ่งในการแยกแยะการแจกแจงต่อเนื่องจากการแจกแจงแบบแยกคือการกำหนดประเภทของตัวเลขที่สามารถประกอบด้วยได้ โดยปกติ การแจกแจงแบบต่อเนื่องสามารถรับค่าใดๆ ก็ได้ รวมถึงเลขฐานสิบด้วย ในขณะที่การแจกแจงแบบแยกสามารถรับได้เฉพาะจำนวนเต็มเท่านั้น โปรดทราบว่าเคล็ดลับนี้ใช้ไม่ได้ในทุกกรณี แต่ในกรณีส่วนใหญ่

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *