การกระจายความน่าจะเป็น

บทความนี้จะอธิบายว่าการแจกแจงความน่าจะเป็นในสถิติเป็นอย่างไร ดังนั้น คุณจะพบคำจำกัดความของการแจกแจงความน่าจะเป็น ตัวอย่างการแจกแจงความน่าจะเป็น และการแจกแจงความน่าจะเป็นประเภทต่างๆ

การแจกแจงความน่าจะเป็นคืออะไร?

การแจกแจงความน่าจะ เป็นคือฟังก์ชันที่กำหนดความน่าจะเป็นที่จะเกิดขึ้นของแต่ละค่าของ ตัวแปรสุ่ม พูดง่ายๆ ก็คือ การแจกแจงความน่าจะเป็นเป็นฟังก์ชันทางคณิตศาสตร์ที่อธิบายความน่าจะเป็นของผลลัพธ์ที่เป็นไปได้ทั้งหมดของการทดลองสุ่ม

ตัวอย่างเช่น ให้

ดังนั้น การแจกแจงความน่าจะเป็นจึงมักใช้ในทฤษฎีและสถิติความน่าจะเป็น เนื่องจากใช้ในการคำนวณความน่าจะเป็นของเหตุการณ์ต่างๆ ใน พื้นที่ตัวอย่าง

ประเภทของการแจกแจงความน่าจะเป็น

การแจกแจงความน่าจะเป็นสามารถแบ่งออกได้เป็น 2 ประเภทกว้างๆ ได้แก่ การแจกแจงแบบไม่ต่อเนื่องและการแจกแจงต่อเนื่อง

  • การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง: การแจกแจงสามารถรับค่าที่นับได้ในช่วงเวลาหนึ่งเท่านั้น โดยปกติแล้ว การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องสามารถรับได้เฉพาะค่าจำนวนเต็มเท่านั้น กล่าวคือ ไม่มีตำแหน่งทศนิยม
  • การกระจายความน่าจะเป็นอย่างต่อเนื่อง: การแจกแจงสามารถรับค่าจำนวนอนันต์ในช่วงเวลาหนึ่ง โดยทั่วไป การแจกแจงความน่าจะเป็นแบบต่อเนื่องสามารถใช้ค่าทศนิยมได้

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง

การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง คือการแจกแจงที่กำหนดความน่าจะเป็นของตัวแปรสุ่มแบบไม่ต่อเนื่อง ดังนั้นการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องสามารถรับค่าจำนวนจำกัดเท่านั้น (โดยปกติจะเป็นค่าจำนวนเต็ม)

การกระจายเครื่องแบบไม่ต่อเนื่อง

การแจกแจงแบบสม่ำเสมอแบบ ไม่ต่อเนื่องคือการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง โดยค่าทั้งหมดมีความน่าจะเป็นที่เท่ากัน กล่าวคือ ในการแจกแจงแบบสม่ำเสมอแบบไม่ต่อเนื่อง ค่าทั้งหมดมีความน่าจะเป็นที่จะเกิดขึ้นเท่ากัน

ตัวอย่างเช่น การทอยลูกเต๋าสามารถกำหนดได้ด้วยการกระจายแบบสม่ำเสมอแบบไม่ต่อเนื่อง เนื่องจากผลลัพธ์ที่เป็นไปได้ทั้งหมด (1, 2, 3, 4, 5 หรือ 6) มีความน่าจะเป็นที่จะเกิดขึ้นเท่ากัน

โดยทั่วไปการแจกแจงแบบสม่ำเสมอแบบไม่ต่อเนื่องจะมีพารามิเตอร์ลักษณะเฉพาะสองตัว คือ a และ b ซึ่งกำหนดช่วงของค่าที่เป็นไปได้ที่การแจกแจงสามารถทำได้ ดังนั้น เมื่อตัวแปรถูกกำหนดโดยการแจกแจงแบบแยกส่วน ตัวแปรนั้นจะถูกเขียนเป็น Uniform(a,b)

X\sim \text{Uniforme}(a,b)

การแจกแจงแบบสม่ำเสมอแบบไม่ต่อเนื่องสามารถใช้เพื่ออธิบายการทดลองสุ่มได้ เพราะหากผลลัพธ์ทั้งหมดมีความน่าจะเป็นเท่ากัน แสดงว่าการทดลองนั้นเป็นแบบสุ่ม

การกระจายเบอร์นูลลี

การแจกแจงแบบแบร์นูลลี หรือที่เรียกว่า การแจกแจงแบบแบ่งขั้ว เป็นการแจกแจงความน่าจะเป็นที่แสดงถึงตัวแปรแยกที่สามารถมีผลลัพธ์ได้เพียง 2 รายการเท่านั้น ได้แก่ “ความสำเร็จ” หรือ “ความล้มเหลว”

ในการแจกแจงแบบแบร์นูลลี “ความสำเร็จ” คือผลลัพธ์ที่เราคาดหวังและมีค่าเท่ากับ 1 ในขณะที่ผลลัพธ์ของ “ความล้มเหลว” คือผลลัพธ์อื่นนอกเหนือจากที่คาดหวังไว้และมีค่าเป็น 0 ดังนั้น หากความน่าจะเป็นของผลลัพธ์ของ “ ความสำเร็จ” คือ p ความน่าจะเป็นของผลลัพธ์ของ “ความล้มเหลว” คือ q=1-p

\begin{array}{c}X\sim \text{Bernoulli}(p)\\[2ex]\begin{array}{l} \text{\'Exito}\ \color{orange}\bm{\longrightarrow}\color{black} \ P[X=1]=p\\[2ex]\text{Fracaso}\ \color{orange}\bm{\longrightarrow}\color{black} \ P[X=0]=q=1-p\end{array}\end{array}

การแจกแจงแบบเบอร์นูลลีตั้งชื่อตามนักสถิติชาวสวิส เจค็อบ เบอร์นูลลี

ในทางสถิติ การแจกแจงแบบแบร์นูลลีส่วนใหญ่มีการใช้งานเพียงอย่างเดียว นั่นคือ การกำหนดความน่าจะเป็นของการทดลองซึ่งมีผลลัพธ์ที่เป็นไปได้เพียงสองอย่างเท่านั้น: สำเร็จและล้มเหลว ดังนั้น การทดลองที่ใช้การแจกแจงแบบแบร์นูลลีจึงเรียกว่าการทดสอบแบบเบอร์นูลลี หรือการทดลองแบบเบอร์นูลลี

หากต้องการข้อมูลเพิ่มเติม: การแจกแจงเบอร์นูลลี

การแจกแจงแบบทวินาม

การแจกแจงแบบทวินาม หรือที่เรียกว่า การแจกแจงแบบทวินาม เป็นการแจกแจงความน่าจะเป็นที่นับจำนวนความสำเร็จเมื่อทำการทดลองแบบแบ่งขั้วอิสระชุดหนึ่งโดยมีความน่าจะเป็นที่จะสำเร็จคงที่ กล่าวอีกนัยหนึ่ง การแจกแจงแบบทวินามคือการแจกแจงที่อธิบายจำนวนผลลัพธ์ที่สำเร็จของลำดับการทดลองเบอร์นูลลี

ตัวอย่างเช่น จำนวนครั้งที่ “หัว” ปรากฏขึ้นเมื่อโยนเหรียญ 25 ครั้ง เป็นการแจกแจงแบบทวินาม

โดยทั่วไป จำนวนการทดลองทั้งหมดที่ดำเนินการจะถูกกำหนดด้วยพารามิเตอร์ n ในขณะที่ p คือความน่าจะเป็นของความสำเร็จของการทดสอบแต่ละครั้ง ดังนั้นตัวแปรสุ่มที่ตามหลังการแจกแจงแบบทวินามจึงเขียนได้ดังนี้

X\sim\text{Bin}(n,p)

โปรดทราบว่าในการแจกแจงแบบทวินาม การทดลองเดียวกันนั้นซ้ำกัน n ครั้ง และการทดลองนั้นเป็นอิสระจากกัน ดังนั้นความน่าจะเป็นที่จะสำเร็จของการทดลองแต่ละครั้งจึงเท่ากัน (p)

ค้นหาเพิ่มเติม: การแจกแจงแบบทวินาม

การกระจายพันธุ์ปลา

การแจกแจงแบบปัวซอง เป็นการแจกแจงความน่าจะเป็นที่กำหนดความน่าจะเป็นของเหตุการณ์จำนวนหนึ่งที่เกิดขึ้นในช่วงเวลาหนึ่ง กล่าวอีกนัยหนึ่ง การแจกแจงปัวซองใช้เพื่อสร้างแบบจำลองตัวแปรสุ่มที่อธิบายจำนวนครั้งที่ปรากฏการณ์เกิดซ้ำในช่วงเวลาหนึ่ง

ตัวอย่างเช่น จำนวนการโทรที่การแลกเปลี่ยนโทรศัพท์ได้รับต่อนาทีเป็นตัวแปรสุ่มแบบไม่ต่อเนื่องที่สามารถกำหนดได้โดยใช้การกระจายแบบปัวซอง

การแจกแจงแบบปัวซองมีพารามิเตอร์ลักษณะเฉพาะ แสดงด้วยตัวอักษรกรีก แล และระบุจำนวนครั้งที่เหตุการณ์ที่ศึกษาคาดว่าจะเกิดขึ้นในช่วงเวลาที่กำหนด

X\sim \text{Poisson}(\lambda)

หากต้องการข้อมูลเพิ่มเติม: การจำหน่ายปลา

การกระจายพหุนาม

การแจกแจงแบบพหุนาม (หรือ การแจกแจงแบบพหุนาม ) เป็นการแจกแจงความน่าจะเป็นที่อธิบายความน่าจะเป็นของเหตุการณ์ที่ไม่เกิดร่วมกันหลายเหตุการณ์ที่เกิดขึ้นตามจำนวนครั้งที่กำหนดหลังการทดลองหลายครั้ง

นั่นคือ ถ้าการทดลองสุ่มสามารถส่งผลให้เกิดเหตุการณ์พิเศษสามเหตุการณ์ขึ้นไป และทราบความน่าจะเป็นของแต่ละเหตุการณ์ที่เกิดขึ้นแยกกัน การแจกแจงแบบพหุนามจะใช้ในการคำนวณความน่าจะเป็นที่เมื่อมีการทดลองหลายครั้ง จะมีเหตุการณ์จำนวนหนึ่งเกิดขึ้น เวลาทุกครั้ง

การแจกแจงแบบพหุนามจึงเป็นลักษณะทั่วไปของการแจกแจงแบบทวินาม

ค้นหาเพิ่มเติม: การแจกแจงพหุนาม

การกระจายทางเรขาคณิต

การแจกแจงทางเรขาคณิต เป็นการแจกแจงความน่าจะเป็นที่กำหนดจำนวนการทดลองเบอร์นูลลีที่จำเป็นเพื่อให้ได้ผลลัพธ์สำเร็จในครั้งแรก นั่นคือกระบวนการแบบจำลองการกระจายทางเรขาคณิตซึ่งมีการทดลองเบอร์นูลลีซ้ำจนกระทั่งหนึ่งในนั้นได้รับผลลัพธ์ที่เป็นบวก

เช่น จำนวนรถที่วิ่งบนทางหลวงจนเห็นรถสีเหลืองเป็นการกระจายตัวทางเรขาคณิต

โปรดจำไว้ว่าการทดสอบเบอร์นูลลีเป็นการทดลองที่มีผลลัพธ์ที่เป็นไปได้สองแบบ: “ความสำเร็จ” และ “ความล้มเหลว” ดังนั้นหากความน่าจะเป็นของ “ความสำเร็จ” คือ p ความน่าจะเป็นของ “ความล้มเหลว” ก็คือ q=1-p

การกระจายตัวทางเรขาคณิตจึงขึ้นอยู่กับพารามิเตอร์ p ซึ่งเป็นความน่าจะเป็นของความสำเร็จของการทดลองทั้งหมดที่ดำเนินการ นอกจากนี้ ความน่าจะเป็น p จะเท่ากันสำหรับการทดลองทั้งหมด

X\sim\text{Geom\'etrica}(p)

ดูข้อมูลเพิ่มเติม: การกระจายตัวทางเรขาคณิต

การแจกแจงแบบทวินามลบ

การแจกแจงแบบทวินามที่เป็นลบ คือการแจกแจงความน่าจะเป็นที่อธิบายจำนวนการทดลองเบอร์นูลลีที่จำเป็นเพื่อให้ได้ผลลัพธ์ที่เป็นบวกตามจำนวนที่กำหนด

ดังนั้น การแจกแจงแบบทวินามที่เป็นลบจึงมีพารามิเตอร์ลักษณะเฉพาะ 2 ตัว ได้แก่ r คือจำนวนผลลัพธ์ที่ต้องการ และ p คือความน่าจะเป็นที่จะประสบความสำเร็จสำหรับการทดลองเบอร์นูลลีแต่ละครั้ง

X\sim \text{BN}(r,p)

ดังนั้น การแจกแจงแบบทวินามที่เป็นลบจะกำหนดกระบวนการที่ดำเนินการทดลองเบอร์นูลลีหลายครั้งเท่าที่จำเป็นเพื่อให้ได้ ผลลัพธ์ ที่เป็นบวก นอกจากนี้ การทดลองของ Bernoulli ทั้งหมดนี้มีความเป็นอิสระและมีความน่าจะเป็นที่จะ ประสบความสำเร็จ อย่างต่อเนื่อง

ตัวอย่างเช่น ตัวแปรสุ่มที่ตามหลังการแจกแจงแบบทวินามที่เป็นลบคือจำนวนครั้งที่ต้องทอยลูกเต๋าจนกระทั่งทอยเลข 6 สามครั้ง

เรียนรู้เพิ่มเติม:การแจกแจงทวินามเชิงลบ

การกระจายแบบไฮเปอร์เรขาคณิต

การแจกแจงแบบไฮเปอร์เรขาคณิต คือการแจกแจงความน่าจะเป็นที่อธิบายจำนวนกรณีที่ประสบความสำเร็จในการสุ่มตัวอย่างโดยไม่ต้องแทนที่องค์ประกอบ n รายการจากประชากร

นั่นคือ การแจกแจงแบบไฮเปอร์เรขาคณิตใช้ในการคำนวณความน่าจะเป็นที่จะได้ x สำเร็จเมื่อแยกองค์ประกอบ n รายการออกจากประชากรโดยไม่ต้องแทนที่องค์ประกอบใดเลย

ดังนั้นการแจกแจงแบบไฮเปอร์เรขาคณิตจึงมีพารามิเตอร์สามตัว:

  • N : คือจำนวนองค์ประกอบในประชากร (N = 0, 1, 2,…)
  • K : คือจำนวนกรณีความสำเร็จสูงสุด (K = 0, 1, 2,…,N) เนื่องจากในการกระจายแบบไฮเปอร์เรขาคณิต องค์ประกอบสามารถพิจารณาได้ว่าเป็น “ความสำเร็จ” หรือ “ความล้มเหลว” เท่านั้น NK จึงเป็นจำนวนกรณีความล้มเหลวสูงสุด
  • n : คือจำนวนการดึงข้อมูลที่ไม่มีการแทนที่ที่ดำเนินการ

X \sim HG(N,K,n)

หากต้องการข้อมูลเพิ่มเติม: การกระจายตัวแบบไฮเปอร์เรขาคณิต

การแจกแจงความน่าจะเป็นอย่างต่อเนื่อง

การแจกแจงความน่าจะเป็นแบบต่อเนื่อง คือค่าที่สามารถรับค่าใดก็ได้ในช่วงเวลาหนึ่ง รวมถึงค่าทศนิยมด้วย ดังนั้น การแจกแจงความน่าจะเป็นแบบต่อเนื่องจะกำหนดความน่าจะเป็นของตัวแปรสุ่มแบบต่อเนื่อง

การกระจายสม่ำเสมอและต่อเนื่อง

การแจกแจงความน่าจะเป็นแบบต่อเนื่อง หรือที่เรียกว่า การแจกแจงแบบสี่เหลี่ยม เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องประเภทหนึ่ง โดยค่าทั้งหมดมีความน่าจะเป็นที่จะปรากฏเท่ากัน กล่าวอีกนัยหนึ่ง การแจกแจงแบบสม่ำเสมออย่างต่อเนื่องคือการแจกแจงที่ความน่าจะเป็นจะกระจายแบบสม่ำเสมอในช่วงเวลาหนึ่ง

การแจกแจงสม่ำเสมอแบบต่อเนื่องใช้เพื่ออธิบายตัวแปรต่อเนื่องที่มีความน่าจะเป็นคงที่ ในทำนองเดียวกัน การแจกแจงแบบสม่ำเสมออย่างต่อเนื่องใช้เพื่อกำหนดกระบวนการสุ่ม เพราะหากผลลัพธ์ทั้งหมดมีความน่าจะเป็นเท่ากัน ก็หมายความว่าผลลัพธ์นั้นมีความสุ่มเกิดขึ้น

การกระจายสม่ำเสมออย่างต่อเนื่องมีพารามิเตอร์ลักษณะเฉพาะสองตัว a และ b ซึ่งกำหนดช่วงความน่าจะเป็นที่เท่ากัน ดังนั้นสัญลักษณ์ของการแจกแจงสม่ำเสมออย่างต่อเนื่องคือ U(a,b) โดยที่ a และ b คือค่าลักษณะเฉพาะของการแจกแจง

X\sim U(a,b)

ตัวอย่างเช่น หากผลลัพธ์ของการทดลองสุ่มสามารถรับค่าใดๆ ระหว่าง 5 ถึง 9 และผลลัพธ์ที่เป็นไปได้ทั้งหมดมีความน่าจะเป็นที่เท่ากันที่จะเกิดขึ้น การทดลองสามารถจำลองได้ด้วยการแจกแจงสม่ำเสมอแบบต่อเนื่อง U(5.9)

การกระจายแบบปกติ

การแจกแจงแบบปกติ คือการแจกแจงความน่าจะเป็นแบบต่อเนื่องซึ่งมีกราฟเป็นรูประฆังและสมมาตรเกี่ยวกับค่าเฉลี่ย ในทางสถิติ การแจกแจงแบบปกติจะใช้เพื่อสร้างแบบจำลองปรากฏการณ์ที่มีลักษณะเฉพาะที่แตกต่างกันมาก ซึ่งเป็นเหตุผลว่าทำไมการแจกแจงนี้จึงมีความสำคัญมาก

ที่จริงแล้ว ในเชิงสถิติ การแจกแจงแบบปกติถือเป็นการแจกแจงที่สำคัญที่สุดของการแจกแจงความน่าจะเป็นทั้งหมด เนื่องจากไม่เพียงแต่สามารถจำลองปรากฏการณ์ในโลกแห่งความเป็นจริงจำนวนมากได้เท่านั้น แต่การแจกแจงแบบปกติยังสามารถใช้เพื่อประมาณค่าการแจกแจงแบบปกติประเภทอื่นๆ ได้อีกด้วย การแจกแจง ภายใต้เงื่อนไขบางประการ

สัญลักษณ์สำหรับการแจกแจงแบบปกติคืออักษรตัวใหญ่ N ดังนั้นเพื่อระบุว่าตัวแปรเป็นไปตามการแจกแจงแบบปกติจึงถูกระบุด้วยตัวอักษร N และค่าของค่าเฉลี่ยเลขคณิตและส่วนเบี่ยงเบนมาตรฐานจะถูกเพิ่มในวงเล็บ

X\sim N(\mu,\sigma)

การแจกแจงแบบปกติมีชื่อเรียกที่แตกต่างกันมากมาย เช่น การแจกแจงแบบเกาส์เซียน การแจกแจงแบบเกาส์เซียน และ การแจกแจงแบบลาปลาซ-เกาส์

เรียนรู้เพิ่มเติม: การแจกแจงแบบปกติ

การกระจายแบบล็อกนอร์มอล

การแจกแจงแบบลอการิทึม หรือ การแจกแจงแบบลอการิทึม คือการแจกแจงความน่าจะเป็นที่กำหนดตัวแปรสุ่มซึ่งลอการิทึมเป็นไปตามการแจกแจงแบบปกติ

ดังนั้น หากตัวแปร X มีการแจกแจงแบบปกติ ฟังก์ชันเลขชี้กำลัง e x ก็จะมีการแจกแจงแบบล็อกนอร์มอล

X\sim \text{Lognormal}(\mu,\sigma^2)

โปรดทราบว่าการแจกแจงแบบลอการิทึมสามารถใช้ได้เฉพาะเมื่อค่าของตัวแปรเป็นบวกเท่านั้น เนื่องจากลอการิทึมเป็นฟังก์ชันที่ยอมรับอาร์กิวเมนต์เชิงบวกเพียงตัวเดียวเท่านั้น

ในการใช้งานต่างๆ ของการแจกแจงแบบ Lognormal ในสถิติ เราจะแยกแยะการใช้การแจกแจงนี้เพื่อวิเคราะห์การลงทุนทางการเงินและดำเนินการวิเคราะห์ความน่าเชื่อถือ

การแจกแจงแบบ Lognormal เรียกอีกอย่าง ว่าการแจกแจง Tinaut ซึ่งบางครั้งก็เขียน เป็นการแจกแจงแบบ Lognormal หรือ การแจกแจงแบบ Log-Normal

ดูข้อมูลเพิ่มเติม: การแจกแจงแบบ Lognormal

การกระจายไคสแควร์

การแจกแจงแบบไคสแควร์ เป็นการแจกแจงความน่าจะเป็นซึ่งมีสัญลักษณ์เป็น χ² แม่นยำยิ่งขึ้น การแจกแจงแบบไคสแควร์คือผลรวมของกำลังสองของตัวแปรสุ่มอิสระ k ที่มีการแจกแจงแบบปกติ

ดังนั้น การแจกแจงแบบไคสแควร์จึงมีดีกรีอิสระเป็น k ดังนั้น การแจกแจงแบบไคสแควร์จึงมีดีกรีอิสระมากเท่ากับผลรวมของกำลังสองของตัวแปรที่แจกแจงตามปกติที่มันเป็นตัวแทน

\displaystyle X\sim\chi^2_k \ \color{orange}\bm{\longrightarrow}\color{black}\ \begin{array}{l}\text{Distribuci\'on chi-cuadrado}\\[2ex]\text{con k grados de libertad}\end{array}

การแจกแจงแบบไคสแควร์เรียกอีกอย่างว่า การแจกแจงแบบเพียร์สัน

การแจกแจงแบบไคสแควร์ใช้กันอย่างแพร่หลายในการอนุมานทางสถิติ เช่น ในการทดสอบสมมติฐานและช่วงความเชื่อมั่น เราจะดูด้านล่างว่าการใช้งานของการแจกแจงความน่าจะเป็นประเภทนี้มีอะไรบ้าง

หากต้องการข้อมูลเพิ่มเติม: การกระจายตัวของไคสแควร์

การกระจายตัวของนักเรียน

การแจกแจงของนักเรียน เป็นการแจกแจงความน่าจะเป็นที่ใช้กันอย่างแพร่หลายในสถิติ โดยเฉพาะอย่างยิ่ง การแจกแจงค่า t ของนักเรียนจะใช้ในการทดสอบ t ของนักเรียนเพื่อหาความแตกต่างระหว่างค่าเฉลี่ยของสองตัวอย่างและเพื่อสร้างช่วงความเชื่อมั่น

การแจกแจงของนักเรียนได้รับการพัฒนาโดยนักสถิติ William Sealy Gosset ในปี 1908 โดยใช้นามแฝงว่า “Student”

การแจกแจงค่า t ของนักเรียนถูกกำหนดโดยจำนวนระดับความอิสระ ซึ่งได้มาจากการลบหนึ่งหน่วยออกจากจำนวนการสังเกตทั้งหมด ดังนั้น สูตรในการกำหนดระดับความเป็นอิสระของการแจกแจงแบบ t ของนักเรียนคือ ν=n-1

\begin{array}{c}\nu=n-1\\[2ex]X\sim t_\nu\end{array}

หากต้องการทราบข้อมูลเพิ่มเติม: การแจกแจงของนักเรียน

สนีเดคคอร์ เอฟ ดิสทริบิวชั่น

การแจกแจงแบบ Snedecor F หรือเรียกอีกอย่างว่า การแจกแจงแบบ Fisher–Snedecor F หรือเรียกง่ายๆ ว่า การแจกแจงแบบ F เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่ใช้ในการอนุมานทางสถิติ โดยเฉพาะในการวิเคราะห์ความแปรปรวน

คุณสมบัติอย่างหนึ่งของการแจกแจง Snedecor F คือถูกกำหนดโดยค่าของพารามิเตอร์จริงสองตัวคือ m และ n ซึ่งระบุระดับความอิสระของมัน ดังนั้น สัญลักษณ์ของการแจกแจง Snedecor F คือ F m,n โดยที่ m และ n คือพารามิเตอร์ที่กำหนดการแจกแจง

F_{m,n}\qquad m,n>0″ title=”Rendered by QuickLaTeX.com” height=”18″ width=”139″ style=”vertical-align: -6px;”></p>
</p>
<p> ในทางคณิตศาสตร์ การแจกแจงของ Snedecor F จะเท่ากับผลหารระหว่างการแจกแจงแบบไคสแควร์หนึ่งกับระดับความเป็นอิสระของมัน หารด้วยผลหารระหว่างการแจกแจงแบบไคสแควร์อื่นกับระดับความอิสระของมัน ดังนั้นสูตรที่กำหนดการกระจาย Snedecor F จึงเป็นดังนี้:</p>
</p>
<p class=\left.\begin{array}{c} X\sim \chi_m^2\\[2ex] Y\sim \chi_n^2\end{array}\right\}\color{orange}\bm{\longrightarrow}\color{black}\ F_{m,n}= \cfrac{X/m}{Y/n}

การกระจายตัวของ Fisher-Snedecor F เป็นชื่อของนักสถิติชาวอังกฤษ Ronald Fisher และ George Snedecor นักสถิติชาวอเมริกัน

ในเชิงสถิติ การแจกแจงของ Fisher-Snedecor F มีการใช้งานที่แตกต่างกัน ตัวอย่างเช่น การแจกแจง Fisher-Snedecor F ใช้เพื่อเปรียบเทียบแบบจำลองการถดถอยเชิงเส้นต่างๆ และการแจกแจงความน่าจะเป็นนี้ใช้ในการวิเคราะห์ความแปรปรวน (ANOVA)

หากต้องการข้อมูลเพิ่มเติม: Snedecor F Distribution

การกระจายแบบเอ็กซ์โปเนนเชียล

การแจกแจงแบบเอกซ์โปเนนเชียล เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่ใช้ในการจำลองเวลารอคอยให้เกิดปรากฏการณ์สุ่ม

แม่นยำยิ่งขึ้น การแจกแจงแบบเอกซ์โพเนนเชียลทำให้สามารถอธิบายเวลารอคอยระหว่างปรากฏการณ์สองประการซึ่งตามหลังการแจกแจงแบบปัวซงได้ ดังนั้นการแจกแจงแบบเอ็กซ์โปเนนเชียลจึงสัมพันธ์อย่างใกล้ชิดกับการแจกแจงแบบปัวซอง

การแจกแจงแบบเอกซ์โปเนนเชียลมีพารามิเตอร์ลักษณะเฉพาะ แสดงด้วยตัวอักษรกรีก γ และระบุจำนวนครั้งที่เหตุการณ์ที่ศึกษาคาดว่าจะเกิดขึ้นในช่วงเวลาที่กำหนด

X\sim \text{Exp}(\lambda)

ในทำนองเดียวกัน การแจกแจงแบบเอกซ์โพเนนเชียลยังใช้ในการจำลองเวลาจนกระทั่งเกิดความล้มเหลวอีกด้วย การแจกแจงแบบเอ็กซ์โปเนนเชียลจึงนำไปประยุกต์ใช้หลายประการในทฤษฎีความน่าเชื่อถือและการอยู่รอด

การกระจายเบต้า

การแจกแจงแบบเบต้า คือการแจกแจงความน่าจะเป็นที่กำหนดในช่วงเวลา (0,1) และกำหนดพารามิเตอร์ด้วยพารามิเตอร์บวกสองตัว: α และ β กล่าวอีกนัยหนึ่งค่าของการแจกแจงเบต้าขึ้นอยู่กับพารามิเตอร์αและβ

ดังนั้นการแจกแจงแบบเบต้าจึงใช้เพื่อกำหนดตัวแปรสุ่มต่อเนื่องซึ่งมีค่าอยู่ระหว่าง 0 ถึง 1

มีสัญลักษณ์หลายประการที่บ่งชี้ว่าตัวแปรสุ่มต่อเนื่องถูกควบคุมโดยการแจกแจงแบบเบต้า ลักษณะที่พบบ่อยที่สุดคือ:

\begin{array}{c}X\sim B(\alpha,\beta)\\[2ex]X\sim Beta(\alpha,\beta)\\[2ex]X\sim \beta_{\alpha,\beta}\end{array}

ตามสถิติแล้ว การแจกแจงแบบเบต้ามีการใช้งานที่หลากหลายมาก ตัวอย่างเช่น การแจกแจงแบบเบต้าใช้เพื่อศึกษาความแปรผันของเปอร์เซ็นต์ในกลุ่มตัวอย่างต่างๆ ในทำนองเดียวกัน ในการจัดการโครงการ การกระจายเบต้าจะใช้เพื่อทำการวิเคราะห์ Pert

เรียนรู้เพิ่มเติม: การเผยแพร่เบต้า

การกระจายแกมมา

การแจกแจงแกมมา เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่กำหนดโดยพารามิเตอร์ลักษณะเฉพาะสองตัว ได้แก่ α และ แล กล่าวอีกนัยหนึ่ง การแจกแจงแกมมาขึ้นอยู่กับค่าของพารามิเตอร์สองตัว: α คือพารามิเตอร์รูปร่าง และ แล คือพารามิเตอร์มาตราส่วน

สัญลักษณ์ของการแจกแจงแกมมาคืออักษรกรีกตัวพิมพ์ใหญ่ Γ ดังนั้น หากตัวแปรสุ่มเป็นไปตามการแจกแจงแกมมา มันจะเขียนได้ดังนี้:

X\sim \Gamma(\alpha,\lambda)

การแจกแจงแกมมายังสามารถกำหนดพารามิเตอร์ได้โดยใช้พารามิเตอร์รูปร่าง k = α และพารามิเตอร์สเกลผกผัน θ = 1/แล ในทุกกรณี พารามิเตอร์สองตัวที่กำหนดการแจกแจงแกมมาเป็นจำนวนจริงบวก

โดยทั่วไปแล้ว การแจกแจงแกมมาจะใช้ในการสร้างแบบจำลองชุดข้อมูลที่เบ้ขวา เพื่อให้ข้อมูลอยู่ทางด้านซ้ายของโครงเรื่องมากขึ้น ตัวอย่างเช่น การแจกแจงแกมมาใช้เพื่อจำลองความน่าเชื่อถือของส่วนประกอบไฟฟ้า

เรียนรู้เพิ่มเติม: การแจกแจงแกมมา

การกระจายไวบูล

การแจกแจงแบบ Weibull เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่กำหนดโดยพารามิเตอร์ลักษณะเฉพาะสองตัว ได้แก่ พารามิเตอร์รูปร่าง α และพารามิเตอร์มาตราส่วน γ

ในทางสถิติ การแจกแจงแบบ Weibull ใช้สำหรับการวิเคราะห์ความอยู่รอดเป็นหลัก ในทำนองเดียวกัน การกระจาย Weibull มีการใช้งานมากมายในสาขาต่างๆ

X\sim\text{Weibull}(\alpha,\lambda)

ตามที่ผู้เขียนระบุ การแจกแจงแบบ Weibull สามารถกำหนดพารามิเตอร์ได้ด้วยพารามิเตอร์สามตัว จากนั้นจะมีการเพิ่มพารามิเตอร์ตัวที่สามที่เรียกว่าค่าเกณฑ์ ซึ่งบ่งชี้ถึงจุดหักล้างที่กราฟการกระจายเริ่มต้น

การแจกแจงแบบ Weibull ตั้งชื่อตาม Waloddi Weibull ชาวสวีเดน ซึ่งอธิบายรายละเอียดไว้ในปี 1951 อย่างไรก็ตาม การแจกแจงแบบ Weibull ถูกค้นพบโดย Maurice Fréchet ในปี 1927 และนำไปใช้ครั้งแรกโดย Rosin และ Rammler ในปี 1933

หากต้องการข้อมูลเพิ่มเติม: การกระจาย Weibull

การกระจายพาเรโต

การแจกแจงแบบพาเรโต เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่ใช้ในสถิติเพื่อจำลองหลักการของพาเรโต ดังนั้นการแจกแจงแบบพาเรโตจึงเป็นการแจกแจงความน่าจะเป็นที่มีค่าไม่กี่ค่าซึ่งความน่าจะเป็นที่จะเกิดขึ้นจะสูงกว่าค่าที่เหลือมาก

โปรดจำไว้ว่ากฎของพาเรโตหรือที่เรียกว่ากฎ 80-20 เป็นหลักการทางสถิติที่บอกว่าสาเหตุของปรากฏการณ์ส่วนใหญ่เกิดจากประชากรส่วนน้อย

การแจกแจงแบบพาเรโตมีพารามิเตอร์ลักษณะเฉพาะสองตัว: พารามิเตอร์มาตราส่วน x m และพารามิเตอร์รูปร่าง α

X\sim \text{Pareto}(\alpha,x_m)

เดิมที การแจกแจงแบบพาเรโตใช้เพื่ออธิบายการกระจายความมั่งคั่งภายในประชากร เนื่องจากส่วนใหญ่มีสาเหตุมาจากสัดส่วนที่น้อยของประชากร แต่ปัจจุบันการจำหน่าย Pareto มีการใช้งานหลายอย่าง เช่น ในการควบคุมคุณภาพ เศรษฐศาสตร์ วิทยาศาสตร์ ในสาขาสังคม เป็นต้น

ค้นหาเพิ่มเติม: การแจกแจง Pareto

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *