การกระจายความน่าจะเป็นอย่างต่อเนื่อง
บทความนี้จะอธิบายว่าการแจกแจงความน่าจะเป็นแบบต่อเนื่องคืออะไร และใช้เพื่ออะไรในสถิติ ดังนั้น คุณจะค้นพบความหมายของการแจกแจงความน่าจะเป็นแบบต่อเนื่อง ตัวอย่างของการแจกแจงแบบต่อเนื่อง และการแจกแจงแบบต่อเนื่องประเภทต่างๆ
การแจกแจงความน่าจะเป็นแบบต่อเนื่องคืออะไร?
การแจกแจงความน่าจะเป็นแบบต่อเนื่อง คือการกระจายตัวที่มี ฟังก์ชันการแจกแจง แบบต่อเนื่อง ดังนั้น การแจกแจงความน่าจะเป็นแบบต่อเนื่องจะกำหนดความน่าจะเป็นของ ตัวแปรสุ่มแบบต่อเนื่อง
ตัวอย่างเช่น การแจกแจงแบบปกติและการแจกแจงแบบ t เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่อง
คุณลักษณะอย่างหนึ่งของการแจกแจงความน่าจะเป็นแบบต่อเนื่องคือสามารถรับค่าใดก็ได้ภายในช่วงเวลาหนึ่ง ดังนั้น การแจกแจงความน่าจะเป็นแบบต่อเนื่องจึงแตกต่างจากการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องซึ่งใช้ค่าทศนิยม
ในการแจกแจงแบบต่อเนื่อง เพื่อคำนวณความน่าจะเป็นสะสม เราต้องหาพื้นที่ใต้เส้นโค้งของการแจกแจง ดังนั้นในการแจกแจงความน่าจะเป็นประเภทนี้ ฟังก์ชันความน่าจะเป็นสะสมจะเทียบเท่ากับอินทิกรัลของ ฟังก์ชันความหนาแน่น
ตัวอย่างของการแจกแจงความน่าจะเป็นแบบต่อเนื่อง
เมื่อเราได้เห็นคำจำกัดความของการแจกแจงความน่าจะเป็นแบบต่อเนื่องแล้ว เราจะเห็นตัวอย่างต่างๆ ของการแจกแจงประเภทนี้เพื่อทำความเข้าใจแนวคิดนี้ให้ดียิ่งขึ้น
ตัวอย่างของการแจกแจงความน่าจะเป็นแบบต่อเนื่อง:
- น้ำหนักของนักเรียนในรายวิชา
- อายุการใช้งานของส่วนประกอบไฟฟ้า
- การทำกำไรของหุ้นของบริษัทที่จดทะเบียนในตลาดหลักทรัพย์
- ความเร็วของรถยนต์
- ราคาของหุ้นบางตัว
ประเภทของการแจกแจงความน่าจะเป็นแบบต่อเนื่อง
การแจกแจงความน่าจะเป็นแบบต่อเนื่องประเภท หลักๆ ได้แก่:
- กระจายสม่ำเสมอและต่อเนื่อง
- การกระจายแบบปกติ
- การกระจายแบบล็อกนอร์มอล
- การกระจายไคสแควร์
- การกระจายตัวของนักเรียน
- สนีเดคคอร์ เอฟ ดิสทริบิวชั่น
- การกระจายแบบเอ็กซ์โปเนนเชียล
- การกระจายเบต้า
- การกระจายแกมมา
- การกระจายไวบูล
- การกระจายพาเรโต
การแจกแจงความน่าจะเป็นแบบต่อเนื่องแต่ละประเภทมีรายละเอียดอธิบายไว้ด้านล่าง
กระจายสม่ำเสมอและต่อเนื่อง
การแจกแจงความน่าจะเป็นแบบต่อเนื่อง หรือที่เรียกว่า การแจกแจงแบบสี่เหลี่ยม เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องประเภทหนึ่ง โดยค่าทั้งหมดมีความน่าจะเป็นที่จะปรากฏเท่ากัน กล่าวอีกนัยหนึ่ง การแจกแจงแบบสม่ำเสมออย่างต่อเนื่องคือการแจกแจงที่ความน่าจะเป็นจะกระจายแบบสม่ำเสมอในช่วงเวลาหนึ่ง
การแจกแจงสม่ำเสมอแบบต่อเนื่องใช้เพื่ออธิบายตัวแปรต่อเนื่องที่มีความน่าจะเป็นคงที่ ในทำนองเดียวกัน การแจกแจงแบบสม่ำเสมออย่างต่อเนื่องใช้เพื่อกำหนดกระบวนการสุ่ม เพราะหากผลลัพธ์ทั้งหมดมีความน่าจะเป็นเท่ากัน ก็หมายความว่าผลลัพธ์นั้นมีความสุ่มเกิดขึ้น
การกระจายสม่ำเสมออย่างต่อเนื่องมีพารามิเตอร์ลักษณะเฉพาะสองตัว a และ b ซึ่งกำหนดช่วงความน่าจะเป็นที่เท่ากัน ดังนั้นสัญลักษณ์ของการแจกแจงสม่ำเสมออย่างต่อเนื่องคือ U(a,b) โดยที่ a และ b คือค่าลักษณะเฉพาะของการแจกแจง
ตัวอย่างเช่น หากผลลัพธ์ของการทดลองสุ่มสามารถรับค่าใดๆ ระหว่าง 5 ถึง 9 และผลลัพธ์ที่เป็นไปได้ทั้งหมดมีความน่าจะเป็นที่เท่ากันที่จะเกิดขึ้น การทดลองสามารถจำลองได้ด้วยการแจกแจงสม่ำเสมอแบบต่อเนื่อง U(5.9)
การกระจายแบบปกติ
การแจกแจงแบบปกติ คือการแจกแจงความน่าจะเป็นแบบต่อเนื่องซึ่งมีกราฟเป็นรูประฆังและสมมาตรเกี่ยวกับค่าเฉลี่ย ในทางสถิติ การแจกแจงแบบปกติจะใช้เพื่อสร้างแบบจำลองปรากฏการณ์ที่มีลักษณะเฉพาะที่แตกต่างกันมาก ซึ่งเป็นเหตุผลว่าทำไมการแจกแจงนี้จึงมีความสำคัญมาก
ที่จริงแล้ว ในเชิงสถิติ การแจกแจงแบบปกติถือเป็นการแจกแจงที่สำคัญที่สุดของการแจกแจงความน่าจะเป็นทั้งหมด เนื่องจากไม่เพียงแต่สามารถจำลองปรากฏการณ์ในโลกแห่งความเป็นจริงจำนวนมากได้เท่านั้น แต่การแจกแจงแบบปกติยังสามารถใช้เพื่อประมาณค่าการแจกแจงแบบปกติประเภทอื่นๆ ได้อีกด้วย การแจกแจง ภายใต้เงื่อนไขบางประการ
สัญลักษณ์สำหรับการแจกแจงแบบปกติคืออักษรตัวใหญ่ N ดังนั้นเพื่อระบุว่าตัวแปรเป็นไปตามการแจกแจงแบบปกติจึงถูกระบุด้วยตัวอักษร N และค่าของค่าเฉลี่ยเลขคณิตและส่วนเบี่ยงเบนมาตรฐานจะถูกเพิ่มในวงเล็บ
การแจกแจงแบบปกติมีชื่อเรียกที่แตกต่างกันมากมาย เช่น การแจกแจงแบบเกาส์เซียน การแจกแจงแบบเกาส์เซียน และ การแจกแจงแบบลาปลาซ-เกาส์
การกระจายแบบล็อกนอร์มอล
การแจกแจงแบบลอการิทึม หรือ การแจกแจงแบบลอการิทึม คือการแจกแจงความน่าจะเป็นที่กำหนดตัวแปรสุ่มซึ่งลอการิทึมเป็นไปตามการแจกแจงแบบปกติ
ดังนั้น หากตัวแปร X มีการแจกแจงแบบปกติ ฟังก์ชันเลขชี้กำลัง e x ก็จะมีการแจกแจงแบบล็อกนอร์มอล
โปรดทราบว่าการแจกแจงแบบลอการิทึมสามารถใช้ได้เฉพาะเมื่อค่าของตัวแปรเป็นบวกเท่านั้น เนื่องจากลอการิทึมเป็นฟังก์ชันที่ยอมรับอาร์กิวเมนต์เชิงบวกเพียงตัวเดียวเท่านั้น
ในการใช้งานต่างๆ ของการแจกแจงแบบ Lognormal ในสถิติ เราจะแยกแยะการใช้การแจกแจงนี้เพื่อวิเคราะห์การลงทุนทางการเงินและดำเนินการวิเคราะห์ความน่าเชื่อถือ
การแจกแจงแบบ Lognormal เรียกอีกอย่าง ว่าการแจกแจง Tinaut ซึ่งบางครั้งก็เขียน เป็นการแจกแจงแบบ Lognormal หรือ การแจกแจงแบบ Log-Normal
การกระจายไคสแควร์
การแจกแจงแบบไคสแควร์ เป็นการแจกแจงความน่าจะเป็นซึ่งมีสัญลักษณ์เป็น χ² แม่นยำยิ่งขึ้น การแจกแจงแบบไคสแควร์คือผลรวมของกำลังสองของตัวแปรสุ่มอิสระ k ที่มีการแจกแจงแบบปกติ
ดังนั้น การแจกแจงแบบไคสแควร์จึงมีดีกรีอิสระเป็น k ดังนั้น การแจกแจงแบบไคสแควร์จึงมีดีกรีอิสระมากเท่ากับผลรวมของกำลังสองของตัวแปรที่แจกแจงตามปกติที่มันเป็นตัวแทน
การแจกแจงแบบไคสแควร์เรียกอีกอย่างว่า การแจกแจงแบบเพียร์สัน
การแจกแจงแบบไคสแควร์ใช้กันอย่างแพร่หลายในการอนุมานทางสถิติ เช่น ในการทดสอบสมมติฐานและช่วงความเชื่อมั่น เราจะดูด้านล่างว่าการใช้งานของการแจกแจงความน่าจะเป็นประเภทนี้มีอะไรบ้าง
การกระจายตัวของนักเรียน
การแจกแจงของนักเรียน เป็นการแจกแจงความน่าจะเป็นที่ใช้กันอย่างแพร่หลายในสถิติ โดยเฉพาะอย่างยิ่ง การแจกแจงค่า t ของนักเรียนจะใช้ในการทดสอบ t ของนักเรียนเพื่อหาความแตกต่างระหว่างค่าเฉลี่ยของสองตัวอย่างและเพื่อสร้างช่วงความเชื่อมั่น
การแจกแจงของนักเรียนได้รับการพัฒนาโดยนักสถิติ William Sealy Gosset ในปี 1908 โดยใช้นามแฝงว่า “Student”
การแจกแจงค่า t ของนักเรียนถูกกำหนดโดยจำนวนระดับความอิสระ ซึ่งได้มาจากการลบหนึ่งหน่วยออกจากจำนวนการสังเกตทั้งหมด ดังนั้น สูตรในการกำหนดระดับความเป็นอิสระของการแจกแจงแบบ t ของนักเรียนคือ ν=n-1
สนีเดคคอร์ เอฟ ดิสทริบิวชั่น
การแจกแจงแบบ Snedecor F หรือเรียกอีกอย่างว่า การแจกแจงแบบ Fisher–Snedecor F หรือเรียกง่ายๆ ว่า การแจกแจงแบบ F เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่ใช้ในการอนุมานทางสถิติ โดยเฉพาะในการวิเคราะห์ความแปรปรวน
คุณสมบัติอย่างหนึ่งของการแจกแจง Snedecor F คือถูกกำหนดโดยค่าของพารามิเตอร์จริงสองตัวคือ m และ n ซึ่งระบุระดับความเป็นอิสระของพวกมัน ดังนั้น สัญลักษณ์ของการแจกแจง Snedecor F คือ F m,n โดยที่ m และ n คือพารามิเตอร์ที่กำหนดการแจกแจง
การกระจายตัวของ Fisher-Snedecor F เป็นชื่อของนักสถิติชาวอังกฤษ Ronald Fisher และ George Snedecor นักสถิติชาวอเมริกัน
ในเชิงสถิติ การแจกแจงของ Fisher-Snedecor F มีการใช้งานที่แตกต่างกัน ตัวอย่างเช่น การแจกแจง Fisher-Snedecor F ใช้เพื่อเปรียบเทียบแบบจำลองการถดถอยเชิงเส้นต่างๆ และการแจกแจงความน่าจะเป็นนี้ใช้ในการวิเคราะห์ความแปรปรวน (ANOVA)
การกระจายแบบเอ็กซ์โปเนนเชียล
การแจกแจงแบบเอกซ์โปเนนเชียล เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่ใช้ในการจำลองเวลารอคอยให้เกิดปรากฏการณ์สุ่ม
แม่นยำยิ่งขึ้น การแจกแจงแบบเอกซ์โพเนนเชียลทำให้สามารถอธิบายเวลารอคอยระหว่างปรากฏการณ์สองประการซึ่งตามหลังการแจกแจงแบบปัวซงได้ ดังนั้นการแจกแจงแบบเอ็กซ์โปเนนเชียลจึงสัมพันธ์อย่างใกล้ชิดกับการแจกแจงแบบปัวซอง
การแจกแจงแบบเอกซ์โปเนนเชียลมีพารามิเตอร์ลักษณะเฉพาะ แสดงด้วยตัวอักษรกรีก γ และระบุจำนวนครั้งที่เหตุการณ์ที่ศึกษาคาดว่าจะเกิดขึ้นในช่วงเวลาที่กำหนด
ในทำนองเดียวกัน การแจกแจงแบบเอกซ์โพเนนเชียลยังใช้ในการจำลองเวลาจนกระทั่งเกิดความล้มเหลวอีกด้วย การแจกแจงแบบเอ็กซ์โปเนนเชียลจึงนำไปประยุกต์ใช้หลายประการในทฤษฎีความน่าเชื่อถือและการอยู่รอด
การกระจายเบต้า
การแจกแจงแบบเบต้า คือการแจกแจงความน่าจะเป็นที่กำหนดในช่วงเวลา (0,1) และกำหนดพารามิเตอร์ด้วยพารามิเตอร์บวกสองตัว: α และ β กล่าวอีกนัยหนึ่งค่าของการแจกแจงเบต้าขึ้นอยู่กับพารามิเตอร์αและβ
ดังนั้นการแจกแจงแบบเบต้าจึงใช้เพื่อกำหนดตัวแปรสุ่มต่อเนื่องซึ่งมีค่าอยู่ระหว่าง 0 ถึง 1
มีสัญลักษณ์หลายประการที่บ่งชี้ว่าตัวแปรสุ่มต่อเนื่องถูกควบคุมโดยการแจกแจงแบบเบต้า ลักษณะที่พบบ่อยที่สุดคือ:
ตามสถิติแล้ว การแจกแจงแบบเบต้ามีการใช้งานที่หลากหลายมาก ตัวอย่างเช่น การแจกแจงแบบเบต้าใช้เพื่อศึกษาความแปรผันของเปอร์เซ็นต์ในกลุ่มตัวอย่างต่างๆ ในทำนองเดียวกัน ในการจัดการโครงการ การกระจายเบต้าจะใช้เพื่อทำการวิเคราะห์ Pert
การกระจายแกมมา
การแจกแจงแกมมา เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่กำหนดโดยพารามิเตอร์ลักษณะเฉพาะสองตัว ได้แก่ α และ แล กล่าวอีกนัยหนึ่ง การแจกแจงแกมมาขึ้นอยู่กับค่าของพารามิเตอร์สองตัว: α คือพารามิเตอร์รูปร่าง และ แล คือพารามิเตอร์มาตราส่วน
สัญลักษณ์ของการแจกแจงแกมมาคืออักษรกรีกตัวพิมพ์ใหญ่ Γ ดังนั้น หากตัวแปรสุ่มเป็นไปตามการแจกแจงแกมมา มันจะเขียนได้ดังนี้:
การแจกแจงแกมมายังสามารถกำหนดพารามิเตอร์ได้โดยใช้พารามิเตอร์รูปร่าง k = α และพารามิเตอร์สเกลผกผัน θ = 1/แล ในทุกกรณี พารามิเตอร์สองตัวที่กำหนดการแจกแจงแกมมาเป็นจำนวนจริงบวก
โดยทั่วไปแล้ว การแจกแจงแกมมาจะใช้ในการสร้างแบบจำลองชุดข้อมูลที่เบ้ขวา เพื่อให้ข้อมูลอยู่ทางด้านซ้ายของกราฟมีความเข้มข้นมากขึ้น ตัวอย่างเช่น การแจกแจงแกมมาใช้เพื่อจำลองความน่าเชื่อถือของส่วนประกอบไฟฟ้า
การกระจายไวบูล
การแจกแจงแบบ Weibull เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่กำหนดโดยพารามิเตอร์ลักษณะเฉพาะสองตัว ได้แก่ พารามิเตอร์รูปร่าง α และพารามิเตอร์มาตราส่วน γ
ในทางสถิติ การแจกแจงแบบ Weibull ใช้สำหรับการวิเคราะห์ความอยู่รอดเป็นหลัก ในทำนองเดียวกัน การกระจาย Weibull มีการใช้งานมากมายในสาขาต่างๆ
ตามที่ผู้เขียนระบุ การแจกแจงแบบ Weibull สามารถกำหนดพารามิเตอร์ได้ด้วยพารามิเตอร์สามตัว จากนั้นจะมีการเพิ่มพารามิเตอร์ตัวที่สามที่เรียกว่าค่าเกณฑ์ ซึ่งบ่งชี้ถึงจุดหักล้างที่กราฟการกระจายเริ่มต้น
การแจกแจงแบบ Weibull ตั้งชื่อตาม Waloddi Weibull ชาวสวีเดน ซึ่งอธิบายรายละเอียดไว้ในปี 1951 อย่างไรก็ตาม การแจกแจงแบบ Weibull ถูกค้นพบโดย Maurice Fréchet ในปี 1927 และนำไปใช้ครั้งแรกโดย Rosin และ Rammler ในปี 1933
การกระจายพาเรโต
การแจกแจงแบบพาเรโต เป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่ใช้ในสถิติเพื่อจำลองหลักการของพาเรโต ดังนั้นการแจกแจงแบบพาเรโตจึงเป็นการแจกแจงความน่าจะเป็นที่มีค่าไม่กี่ค่าซึ่งความน่าจะเป็นที่จะเกิดขึ้นจะสูงกว่าค่าที่เหลือมาก
โปรดจำไว้ว่ากฎของพาเรโตหรือที่เรียกว่ากฎ 80-20 เป็นหลักการทางสถิติที่บอกว่าสาเหตุของปรากฏการณ์ส่วนใหญ่เกิดจากประชากรส่วนน้อย
การแจกแจงแบบพาเรโตมีพารามิเตอร์ลักษณะเฉพาะสองตัว: พารามิเตอร์มาตราส่วน x m และพารามิเตอร์รูปร่าง α
เดิมที การแจกแจงแบบพาเรโตใช้เพื่ออธิบายการกระจายความมั่งคั่งภายในประชากร เนื่องจากส่วนใหญ่มีสาเหตุมาจากสัดส่วนที่น้อยของประชากร แต่ปัจจุบันการจำหน่าย Pareto มีการใช้งานหลายอย่าง เช่น ในการควบคุมคุณภาพ เศรษฐศาสตร์ วิทยาศาสตร์ ในสาขาสังคม เป็นต้น
การกระจายความน่าจะเป็นแบบต่อเนื่องและไม่ต่อเนื่อง
การแจกแจงความน่าจะเป็นสามารถจำแนกได้เป็นการแจกแจงแบบต่อเนื่องและการแจกแจงแบบไม่ต่อเนื่อง สุดท้ายนี้ เรามาดูกันว่าอะไรคือความแตกต่างระหว่างการแจกแจงความน่าจะเป็นทั้งสองประเภทนี้
ความแตกต่างระหว่างการแจกแจงความน่าจะเป็นแบบต่อเนื่องและการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง คือจำนวนค่าที่สามารถรับได้ การแจกแจงแบบต่อเนื่องสามารถรับค่าได้เป็นจำนวนอนันต์ในช่วงเวลาหนึ่ง ในขณะที่การแจกแจงแบบไม่ต่อเนื่องสามารถรับค่าที่นับได้ในช่วงเวลาหนึ่งเท่านั้น
ดังนั้น โดยทั่วไป วิธีหนึ่งในการแยกแยะการแจกแจงต่อเนื่องจากการแจกแจงแบบแยกคือตามประเภทของตัวเลขที่สามารถรับได้ โดยปกติ การแจกแจงแบบต่อเนื่องสามารถรับค่าใดๆ ก็ได้ รวมถึงเลขฐานสิบด้วย ในขณะที่การแจกแจงแบบแยกสามารถรับได้เฉพาะจำนวนเต็มเท่านั้น