การกระจายความน่าจะเป็นอย่างต่อเนื่อง

บทความนี้จะอธิบายว่าการแจกแจงความน่าจะเป็นแบบต่อเนื่องคืออะไร และใช้เพื่ออะไรในสถิติ ดังนั้น คุณจะค้นพบความหมายของการแจกแจงความน่าจะเป็นแบบต่อเนื่อง ตัวอย่างของการแจกแจงแบบต่อเนื่อง และการแจกแจงแบบต่อเนื่องประเภทต่างๆ

การแจกแจงความน่าจะเป็นแบบต่อเนื่องคืออะไร?

การแจกแจงความน่าจะเป็นแบบต่อเนื่อง คือการกระจายตัวที่มี ฟังก์ชันการแจกแจง แบบต่อเนื่อง ดังนั้น การแจกแจงความน่าจะเป็นแบบต่อเนื่องจะกำหนดความน่าจะเป็นของ ตัวแปรสุ่มแบบต่อเนื่อง

ตัวอย่างเช่น การแจกแจงแบบปกติและการแจกแจงแบบ t เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่อง

คุณลักษณะอย่างหนึ่งของการแจกแจงความน่าจะเป็นแบบต่อเนื่องคือสามารถรับค่าใดก็ได้ภายในช่วงเวลาหนึ่ง ดังนั้น การแจกแจงความน่าจะเป็นแบบต่อเนื่องจึงแตกต่างจากการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องซึ่งใช้ค่าทศนิยม

ในการแจกแจงแบบต่อเนื่อง เพื่อคำนวณความน่าจะเป็นสะสม เราต้องหาพื้นที่ใต้เส้นโค้งของการแจกแจง ดังนั้นในการแจกแจงความน่าจะเป็นประเภทนี้ ฟังก์ชันความน่าจะเป็นสะสมจะเทียบเท่ากับอินทิกรัลของ ฟังก์ชันความหนาแน่น

\displaystyle P[X\leq x]=\int_{-\infty}^x f(x)dx

ตัวอย่างของการแจกแจงความน่าจะเป็นแบบต่อเนื่อง

เมื่อเราได้เห็นคำจำกัดความของการแจกแจงความน่าจะเป็นแบบต่อเนื่องแล้ว เราจะเห็นตัวอย่างต่างๆ ของการแจกแจงประเภทนี้เพื่อทำความเข้าใจแนวคิดนี้ให้ดียิ่งขึ้น

ตัวอย่างของการแจกแจงความน่าจะเป็นแบบต่อเนื่อง:

  1. น้ำหนักของนักเรียนในรายวิชา
  2. อายุการใช้งานของส่วนประกอบไฟฟ้า
  3. การทำกำไรของหุ้นของบริษัทที่จดทะเบียนในตลาดหลักทรัพย์
  4. ความเร็วของรถยนต์
  5. ราคาของหุ้นบางตัว

ประเภทของการแจกแจงความน่าจะเป็นแบบต่อเนื่อง

การแจกแจงความน่าจะเป็นแบบต่อเนื่องประเภท หลักๆ ได้แก่:

  • กระจายสม่ำเสมอและต่อเนื่อง
  • การกระจายแบบปกติ
  • การกระจายแบบล็อกนอร์มอล
  • การกระจายไคสแควร์
  • การกระจายตัวของนักเรียน
  • สนีเดคคอร์ เอฟ ดิสทริบิวชั่น
  • การกระจายแบบเอ็กซ์โปเนนเชียล
  • การกระจายเบต้า
  • การกระจายแกมมา
  • การกระจายไวบูล
  • การกระจายพาเรโต

การแจกแจงความน่าจะเป็นแบบต่อเนื่องแต่ละประเภทมีรายละเอียดอธิบายไว้ด้านล่าง

กระจายสม่ำเสมอและต่อเนื่อง

การแจกแจงความน่าจะเป็นแบบต่อเนื่อง หรือที่เรียกว่า การแจกแจงแบบสี่เหลี่ยม เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องประเภทหนึ่ง โดยค่าทั้งหมดมีความน่าจะเป็นที่จะปรากฏเท่ากัน กล่าวอีกนัยหนึ่ง การแจกแจงแบบสม่ำเสมออย่างต่อเนื่องคือการแจกแจงที่ความน่าจะเป็นจะกระจายแบบสม่ำเสมอในช่วงเวลาหนึ่ง

การแจกแจงสม่ำเสมอแบบต่อเนื่องใช้เพื่ออธิบายตัวแปรต่อเนื่องที่มีความน่าจะเป็นคงที่ ในทำนองเดียวกัน การแจกแจงแบบสม่ำเสมออย่างต่อเนื่องใช้เพื่อกำหนดกระบวนการสุ่ม เพราะหากผลลัพธ์ทั้งหมดมีความน่าจะเป็นเท่ากัน ก็หมายความว่าผลลัพธ์นั้นมีความสุ่มเกิดขึ้น

การกระจายสม่ำเสมออย่างต่อเนื่องมีพารามิเตอร์ลักษณะเฉพาะสองตัว a และ b ซึ่งกำหนดช่วงความน่าจะเป็นที่เท่ากัน ดังนั้นสัญลักษณ์ของการแจกแจงสม่ำเสมออย่างต่อเนื่องคือ U(a,b) โดยที่ a และ b คือค่าลักษณะเฉพาะของการแจกแจง

X\sim U(a,b)

ตัวอย่างเช่น หากผลลัพธ์ของการทดลองสุ่มสามารถรับค่าใดๆ ระหว่าง 5 ถึง 9 และผลลัพธ์ที่เป็นไปได้ทั้งหมดมีความน่าจะเป็นที่เท่ากันที่จะเกิดขึ้น การทดลองสามารถจำลองได้ด้วยการแจกแจงสม่ำเสมอแบบต่อเนื่อง U(5.9)

การกระจายแบบปกติ

การแจกแจงแบบปกติ คือการแจกแจงความน่าจะเป็นแบบต่อเนื่องซึ่งมีกราฟเป็นรูประฆังและสมมาตรเกี่ยวกับค่าเฉลี่ย ในทางสถิติ การแจกแจงแบบปกติจะใช้เพื่อสร้างแบบจำลองปรากฏการณ์ที่มีลักษณะเฉพาะที่แตกต่างกันมาก ซึ่งเป็นเหตุผลว่าทำไมการแจกแจงนี้จึงมีความสำคัญมาก

ที่จริงแล้ว ในเชิงสถิติ การแจกแจงแบบปกติถือเป็นการแจกแจงที่สำคัญที่สุดของการแจกแจงความน่าจะเป็นทั้งหมด เนื่องจากไม่เพียงแต่สามารถจำลองปรากฏการณ์ในโลกแห่งความเป็นจริงจำนวนมากได้เท่านั้น แต่การแจกแจงแบบปกติยังสามารถใช้เพื่อประมาณค่าการแจกแจงแบบปกติประเภทอื่นๆ ได้อีกด้วย การแจกแจง ภายใต้เงื่อนไขบางประการ

สัญลักษณ์สำหรับการแจกแจงแบบปกติคืออักษรตัวใหญ่ N ดังนั้นเพื่อระบุว่าตัวแปรเป็นไปตามการแจกแจงแบบปกติจึงถูกระบุด้วยตัวอักษร N และค่าของค่าเฉลี่ยเลขคณิตและส่วนเบี่ยงเบนมาตรฐานจะถูกเพิ่มในวงเล็บ

X\sim N(\mu,\sigma)

การแจกแจงแบบปกติมีชื่อเรียกที่แตกต่างกันมากมาย เช่น การแจกแจงแบบเกาส์เซียน การแจกแจงแบบเกาส์เซียน และ การแจกแจงแบบลาปลาซ-เกาส์

การกระจายแบบล็อกนอร์มอล

การแจกแจงแบบลอการิทึม หรือ การแจกแจงแบบลอการิทึม คือการแจกแจงความน่าจะเป็นที่กำหนดตัวแปรสุ่มซึ่งลอการิทึมเป็นไปตามการแจกแจงแบบปกติ

ดังนั้น หากตัวแปร X มีการแจกแจงแบบปกติ ฟังก์ชันเลขชี้กำลัง e x ก็จะมีการแจกแจงแบบล็อกนอร์มอล

X\sim \text{Lognormal}(\mu,\sigma^2)

โปรดทราบว่าการแจกแจงแบบลอการิทึมสามารถใช้ได้เฉพาะเมื่อค่าของตัวแปรเป็นบวกเท่านั้น เนื่องจากลอการิทึมเป็นฟังก์ชันที่ยอมรับอาร์กิวเมนต์เชิงบวกเพียงตัวเดียวเท่านั้น

ในการใช้งานต่างๆ ของการแจกแจงแบบ Lognormal ในสถิติ เราจะแยกแยะการใช้การแจกแจงนี้เพื่อวิเคราะห์การลงทุนทางการเงินและดำเนินการวิเคราะห์ความน่าเชื่อถือ

การแจกแจงแบบ Lognormal เรียกอีกอย่าง ว่าการแจกแจง Tinaut ซึ่งบางครั้งก็เขียน เป็นการแจกแจงแบบ Lognormal หรือ การแจกแจงแบบ Log-Normal

การกระจายไคสแควร์

การแจกแจงแบบไคสแควร์ เป็นการแจกแจงความน่าจะเป็นซึ่งมีสัญลักษณ์เป็น χ² แม่นยำยิ่งขึ้น การแจกแจงแบบไคสแควร์คือผลรวมของกำลังสองของตัวแปรสุ่มอิสระ k ที่มีการแจกแจงแบบปกติ

ดังนั้น การแจกแจงแบบไคสแควร์จึงมีดีกรีอิสระเป็น k ดังนั้น การแจกแจงแบบไคสแควร์จึงมีดีกรีอิสระมากเท่ากับผลรวมของกำลังสองของตัวแปรที่แจกแจงตามปกติที่มันเป็นตัวแทน

\displaystyle X\sim\chi^2_k \ \color{orange}\bm{\longrightarrow}\color{black}\ \begin{array}{l}\text{Distribuci\'on chi-cuadrado}\\[2ex]\text{con k grados de libertad}\end{array}

การแจกแจงแบบไคสแควร์เรียกอีกอย่างว่า การแจกแจงแบบเพียร์สัน

การแจกแจงแบบไคสแควร์ใช้กันอย่างแพร่หลายในการอนุมานทางสถิติ เช่น ในการทดสอบสมมติฐานและช่วงความเชื่อมั่น เราจะดูด้านล่างว่าการใช้งานของการแจกแจงความน่าจะเป็นประเภทนี้มีอะไรบ้าง

การกระจายตัวของนักเรียน

การแจกแจงของนักเรียน เป็นการแจกแจงความน่าจะเป็นที่ใช้กันอย่างแพร่หลายในสถิติ โดยเฉพาะอย่างยิ่ง การแจกแจงค่า t ของนักเรียนจะใช้ในการทดสอบ t ของนักเรียนเพื่อหาความแตกต่างระหว่างค่าเฉลี่ยของสองตัวอย่างและเพื่อสร้างช่วงความเชื่อมั่น

การแจกแจงของนักเรียนได้รับการพัฒนาโดยนักสถิติ William Sealy Gosset ในปี 1908 โดยใช้นามแฝงว่า “Student”

การแจกแจงค่า t ของนักเรียนถูกกำหนดโดยจำนวนระดับความอิสระ ซึ่งได้มาจากการลบหนึ่งหน่วยออกจากจำนวนการสังเกตทั้งหมด ดังนั้น สูตรในการกำหนดระดับความเป็นอิสระของการแจกแจงแบบ t ของนักเรียนคือ ν=n-1

\begin{array}{c}\nu=n-1\\[2ex]X\sim t_\nu\end{array}

สนีเดคคอร์ เอฟ ดิสทริบิวชั่น

การแจกแจงแบบ Snedecor F หรือเรียกอีกอย่างว่า การแจกแจงแบบ Fisher–Snedecor F หรือเรียกง่ายๆ ว่า การแจกแจงแบบ F เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่ใช้ในการอนุมานทางสถิติ โดยเฉพาะในการวิเคราะห์ความแปรปรวน

คุณสมบัติอย่างหนึ่งของการแจกแจง Snedecor F คือถูกกำหนดโดยค่าของพารามิเตอร์จริงสองตัวคือ m และ n ซึ่งระบุระดับความเป็นอิสระของพวกมัน ดังนั้น สัญลักษณ์ของการแจกแจง Snedecor F คือ F m,n โดยที่ m และ n คือพารามิเตอร์ที่กำหนดการแจกแจง

F_{m,n}\qquad m,n>0″ title=”Rendered by QuickLaTeX.com” height=”18″ width=”139″ style=”vertical-align: -6px;”></p>
</p>
<p> ในทางคณิตศาสตร์ การแจกแจงของ Snedecor F จะเท่ากับผลหารระหว่างการแจกแจงแบบไคสแควร์หนึ่งกับระดับความเป็นอิสระของมัน หารด้วยผลหารระหว่างการแจกแจงแบบไคสแควร์อื่นกับระดับความอิสระของมัน ดังนั้นสูตรที่กำหนดการกระจาย Snedecor F จึงเป็นดังนี้:</p>
</p>
<p class=\left.\begin{array}{c} X\sim \chi_m^2\\[2ex] Y\sim \chi_n^2\end{array}\right\}\color{orange}\bm{\longrightarrow}\color{black}\ F_{m,n}= \cfrac{X/m}{Y/n}

การกระจายตัวของ Fisher-Snedecor F เป็นชื่อของนักสถิติชาวอังกฤษ Ronald Fisher และ George Snedecor นักสถิติชาวอเมริกัน

ในเชิงสถิติ การแจกแจงของ Fisher-Snedecor F มีการใช้งานที่แตกต่างกัน ตัวอย่างเช่น การแจกแจง Fisher-Snedecor F ใช้เพื่อเปรียบเทียบแบบจำลองการถดถอยเชิงเส้นต่างๆ และการแจกแจงความน่าจะเป็นนี้ใช้ในการวิเคราะห์ความแปรปรวน (ANOVA)

การกระจายแบบเอ็กซ์โปเนนเชียล

การแจกแจงแบบเอกซ์โปเนนเชียล เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่ใช้ในการจำลองเวลารอคอยให้เกิดปรากฏการณ์สุ่ม

แม่นยำยิ่งขึ้น การแจกแจงแบบเอกซ์โพเนนเชียลทำให้สามารถอธิบายเวลารอคอยระหว่างปรากฏการณ์สองประการซึ่งตามหลังการแจกแจงแบบปัวซงได้ ดังนั้นการแจกแจงแบบเอ็กซ์โปเนนเชียลจึงสัมพันธ์อย่างใกล้ชิดกับการแจกแจงแบบปัวซอง

การแจกแจงแบบเอกซ์โปเนนเชียลมีพารามิเตอร์ลักษณะเฉพาะ แสดงด้วยตัวอักษรกรีก γ และระบุจำนวนครั้งที่เหตุการณ์ที่ศึกษาคาดว่าจะเกิดขึ้นในช่วงเวลาที่กำหนด

X\sim \text{Exp}(\lambda)

ในทำนองเดียวกัน การแจกแจงแบบเอกซ์โพเนนเชียลยังใช้ในการจำลองเวลาจนกระทั่งเกิดความล้มเหลวอีกด้วย การแจกแจงแบบเอ็กซ์โปเนนเชียลจึงนำไปประยุกต์ใช้หลายประการในทฤษฎีความน่าเชื่อถือและการอยู่รอด

การกระจายเบต้า

การแจกแจงแบบเบต้า คือการแจกแจงความน่าจะเป็นที่กำหนดในช่วงเวลา (0,1) และกำหนดพารามิเตอร์ด้วยพารามิเตอร์บวกสองตัว: α และ β กล่าวอีกนัยหนึ่งค่าของการแจกแจงเบต้าขึ้นอยู่กับพารามิเตอร์αและβ

ดังนั้นการแจกแจงแบบเบต้าจึงใช้เพื่อกำหนดตัวแปรสุ่มต่อเนื่องซึ่งมีค่าอยู่ระหว่าง 0 ถึง 1

มีสัญลักษณ์หลายประการที่บ่งชี้ว่าตัวแปรสุ่มต่อเนื่องถูกควบคุมโดยการแจกแจงแบบเบต้า ลักษณะที่พบบ่อยที่สุดคือ:

\begin{array}{c}X\sim B(\alpha,\beta)\\[2ex]X\sim Beta(\alpha,\beta)\\[2ex]X\sim \beta_{\alpha,\beta}\end{array}

ตามสถิติแล้ว การแจกแจงแบบเบต้ามีการใช้งานที่หลากหลายมาก ตัวอย่างเช่น การแจกแจงแบบเบต้าใช้เพื่อศึกษาความแปรผันของเปอร์เซ็นต์ในกลุ่มตัวอย่างต่างๆ ในทำนองเดียวกัน ในการจัดการโครงการ การกระจายเบต้าจะใช้เพื่อทำการวิเคราะห์ Pert

การกระจายแกมมา

การแจกแจงแกมมา เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่กำหนดโดยพารามิเตอร์ลักษณะเฉพาะสองตัว ได้แก่ α และ แล กล่าวอีกนัยหนึ่ง การแจกแจงแกมมาขึ้นอยู่กับค่าของพารามิเตอร์สองตัว: α คือพารามิเตอร์รูปร่าง และ แล คือพารามิเตอร์มาตราส่วน

สัญลักษณ์ของการแจกแจงแกมมาคืออักษรกรีกตัวพิมพ์ใหญ่ Γ ดังนั้น หากตัวแปรสุ่มเป็นไปตามการแจกแจงแกมมา มันจะเขียนได้ดังนี้:

X\sim \Gamma(\alpha,\lambda)

การแจกแจงแกมมายังสามารถกำหนดพารามิเตอร์ได้โดยใช้พารามิเตอร์รูปร่าง k = α และพารามิเตอร์สเกลผกผัน θ = 1/แล ในทุกกรณี พารามิเตอร์สองตัวที่กำหนดการแจกแจงแกมมาเป็นจำนวนจริงบวก

โดยทั่วไปแล้ว การแจกแจงแกมมาจะใช้ในการสร้างแบบจำลองชุดข้อมูลที่เบ้ขวา เพื่อให้ข้อมูลอยู่ทางด้านซ้ายของกราฟมีความเข้มข้นมากขึ้น ตัวอย่างเช่น การแจกแจงแกมมาใช้เพื่อจำลองความน่าเชื่อถือของส่วนประกอบไฟฟ้า

การกระจายไวบูล

การแจกแจงแบบ Weibull เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่กำหนดโดยพารามิเตอร์ลักษณะเฉพาะสองตัว ได้แก่ พารามิเตอร์รูปร่าง α และพารามิเตอร์มาตราส่วน γ

ในทางสถิติ การแจกแจงแบบ Weibull ใช้สำหรับการวิเคราะห์ความอยู่รอดเป็นหลัก ในทำนองเดียวกัน การกระจาย Weibull มีการใช้งานมากมายในสาขาต่างๆ

X\sim\text{Weibull}(\alpha,\lambda)

ตามที่ผู้เขียนระบุ การแจกแจงแบบ Weibull สามารถกำหนดพารามิเตอร์ได้ด้วยพารามิเตอร์สามตัว จากนั้นจะมีการเพิ่มพารามิเตอร์ตัวที่สามที่เรียกว่าค่าเกณฑ์ ซึ่งบ่งชี้ถึงจุดหักล้างที่กราฟการกระจายเริ่มต้น

การแจกแจงแบบ Weibull ตั้งชื่อตาม Waloddi Weibull ชาวสวีเดน ซึ่งอธิบายรายละเอียดไว้ในปี 1951 อย่างไรก็ตาม การแจกแจงแบบ Weibull ถูกค้นพบโดย Maurice Fréchet ในปี 1927 และนำไปใช้ครั้งแรกโดย Rosin และ Rammler ในปี 1933

การกระจายพาเรโต

การแจกแจงแบบพาเรโต เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่ใช้ในสถิติเพื่อจำลองหลักการของพาเรโต ดังนั้นการแจกแจงแบบพาเรโตจึงเป็นการแจกแจงความน่าจะเป็นที่มีค่าไม่กี่ค่าซึ่งความน่าจะเป็นที่จะเกิดขึ้นจะสูงกว่าค่าที่เหลือมาก

โปรดจำไว้ว่ากฎของพาเรโตหรือที่เรียกว่ากฎ 80-20 เป็นหลักการทางสถิติที่บอกว่าสาเหตุของปรากฏการณ์ส่วนใหญ่เกิดจากประชากรส่วนน้อย

การแจกแจงแบบพาเรโตมีพารามิเตอร์ลักษณะเฉพาะสองตัว: พารามิเตอร์มาตราส่วน x m และพารามิเตอร์รูปร่าง α

X\sim \text{Pareto}(\alpha,x_m)

เดิมที การแจกแจงแบบพาเรโตใช้เพื่ออธิบายการกระจายความมั่งคั่งภายในประชากร เนื่องจากส่วนใหญ่มีสาเหตุมาจากสัดส่วนที่น้อยของประชากร แต่ปัจจุบันการจำหน่าย Pareto มีการใช้งานหลายอย่าง เช่น ในการควบคุมคุณภาพ เศรษฐศาสตร์ วิทยาศาสตร์ ในสาขาสังคม เป็นต้น

การกระจายความน่าจะเป็นแบบต่อเนื่องและไม่ต่อเนื่อง

การแจกแจงความน่าจะเป็นสามารถจำแนกได้เป็นการแจกแจงแบบต่อเนื่องและการแจกแจงแบบไม่ต่อเนื่อง สุดท้ายนี้ เรามาดูกันว่าอะไรคือความแตกต่างระหว่างการแจกแจงความน่าจะเป็นทั้งสองประเภทนี้

ความแตกต่างระหว่างการแจกแจงความน่าจะเป็นแบบต่อเนื่องและการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง คือจำนวนค่าที่สามารถรับได้ การแจกแจงแบบต่อเนื่องสามารถรับค่าได้เป็นจำนวนอนันต์ในช่วงเวลาหนึ่ง ในขณะที่การแจกแจงแบบไม่ต่อเนื่องสามารถรับค่าที่นับได้ในช่วงเวลาหนึ่งเท่านั้น

ดังนั้น โดยทั่วไป วิธีหนึ่งในการแยกแยะการแจกแจงต่อเนื่องจากการแจกแจงแบบแยกคือตามประเภทของตัวเลขที่สามารถรับได้ โดยปกติ การแจกแจงแบบต่อเนื่องสามารถรับค่าใดๆ ก็ได้ รวมถึงเลขฐานสิบด้วย ในขณะที่การแจกแจงแบบแยกสามารถรับได้เฉพาะจำนวนเต็มเท่านั้น

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *