การวัดการกระจายตัว
ในบทความนี้ คุณจะได้เรียนรู้ว่าการวัดการกระจายคืออะไร และตัวชี้วัดทางสถิติเหล่านี้นำไปใช้ทำอะไร นอกจากนี้ คุณยังดูได้ว่าแต่ละการวัดการกระจายมีการคำนวณอย่างไร
มาตรการการกระจายตัวคืออะไร?
การวัดการกระจายตัว เป็นการวัดทางสถิติที่ระบุการกระจายตัวของชุดข้อมูล กล่าวคือ มีการใช้มาตรการการกระจายตัวเพื่อประเมินระดับการกระจายตัวของข้อมูลในตัวอย่าง
มาตรการการกระจายเรียกอีกอย่างว่า มาตรการความแปรปรวน หรือ มาตรการการแพร่กระจาย
มาตรการกระจายตัวมีอะไรบ้าง?
มาตรการการกระจาย มีดังนี้:
- ส่วนเบี่ยงเบนมาตรฐาน (หรือส่วนเบี่ยงเบนมาตรฐาน)
- ความแปรปรวน
- ค่าสัมประสิทธิ์ของการแปรผัน
- เรียบร้อย
- พิสัยระหว่างควอไทล์
- ความแตกต่างปานกลาง
ข้อมูลต่อไปนี้จะอธิบายวิธีการกำหนดการวัดการกระจายแต่ละรายการ
ส่วนเบี่ยงเบนมาตรฐาน
ค่าเบี่ยงเบนมาตรฐาน หรือที่เรียกว่า ค่าเบี่ยงเบนทั่วไป มีค่าเท่ากับรากที่สองของผลรวมของกำลังสองของการเบี่ยงเบนของชุดข้อมูลหารด้วยจำนวนการสังเกตทั้งหมด
สูตรสำหรับการวัดการกระจายตัวจึงเป็นดังนี้:
ความแปรปรวน
ความแปรปรวน เท่ากับผลรวมของกำลังสองของส่วนที่เหลือต่อจำนวนการสังเกตทั้งหมด สูตรสำหรับการวัดการกระจายตัวจึงเป็นดังนี้:
ทอง:
-
คือตัวแปรสุ่มที่คุณต้องการคำนวณความแปรปรวน
-
คือค่าข้อมูล
.
-
คือจำนวนการสังเกตทั้งหมด
-
คือค่าเฉลี่ยของตัวแปรสุ่ม
.
ค่าสัมประสิทธิ์ของการแปรผัน
ในสถิติ ค่าสัมประสิทธิ์ของการแปรผัน คือการวัดการกระจายตัวที่ใช้ในการกำหนดการกระจายตัวของชุดข้อมูลที่สัมพันธ์กับค่าเฉลี่ย ค่าสัมประสิทธิ์ของการแปรผันคำนวณโดยการหารค่าเบี่ยงเบนมาตรฐานของข้อมูลด้วยค่าเฉลี่ย จากนั้นคูณด้วย 100 เพื่อแสดงค่าเป็นเปอร์เซ็นต์
เรียบร้อย
ช่วง คือการวัดการกระจายตัวที่ระบุความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของข้อมูลในตัวอย่าง ดังนั้น ในการคำนวณขอบเขตของประชากรหรือตัวอย่างทางสถิติ ค่าสูงสุดจะต้องลบออกจากค่าต่ำสุด
พิสัยระหว่างควอไทล์
ช่วงระหว่างควอร์ไทล์ หรือที่เรียกว่า ช่วงระหว่างควอไทล์ เป็นหน่วยวัดการกระจายตัวทางสถิติที่ระบุความแตกต่างระหว่างควอร์ไทล์ที่ 3 และควอไทล์ที่ 1
ดังนั้น ในการคำนวณช่วงระหว่างควอร์ไทล์ของชุดข้อมูลทางสถิติ คุณต้องค้นหาควอไทล์ที่สามและควอไทล์ที่หนึ่งก่อนแล้วจึงลบออก
สัญลักษณ์ของพิสัยระหว่างควอไทล์คือ IQR ซึ่งมาจาก พิสัยระหว่างควอไทล์ ภาษาอังกฤษ
คุณลักษณะที่ได้เปรียบที่สุดอย่างหนึ่งของการวัดการกระจายตัวนี้คือเป็นสถิติที่แข็งแกร่ง กล่าวคือ มีความคงทนสูงสำหรับค่าผิดปกติ เนื่องจากค่าสุดขั้วไม่ได้ถูกนำมาพิจารณาในการคำนวณช่วงระหว่างควอไทล์ ค่าของมันจะเปลี่ยนแปลงน้อยมากหากมี ค่าผิดปกติ ใหม่ปรากฏขึ้น
ความแตกต่างปานกลาง
ค่าเฉลี่ยส่วนเบี่ยงเบน หรือที่เรียกว่า ค่าเฉลี่ยส่วนเบี่ยงเบนสัมบูรณ์ คือค่าเฉลี่ยของการเบี่ยงเบนสัมบูรณ์ ค่าเบี่ยงเบนเฉลี่ยจึงเท่ากับผลรวมของการเบี่ยงเบนของแต่ละรายการข้อมูลจากค่าเฉลี่ยเลขคณิตหารด้วยจำนวนรายการข้อมูลทั้งหมด
การวัดการกระจายตัวใช้เพื่ออะไร?
การวัดการกระจายตัวใช้เพื่อประเมินการกระจายตัวของตัวอย่างทางสถิติ นั่นคือการวัดการกระจายช่วยให้เราสามารถวัดปริมาณการกระจายตัวของชุดข้อมูลและจากค่าที่ได้รับสามารถวิเคราะห์การกระจายตัวของตัวอย่างข้อมูลได้
มาตรการการกระจายมีการใช้กันอย่างแพร่หลายเนื่องจากช่วยอธิบายตัวอย่างข้อมูล การวัดการกระจายช่วยให้เข้าใจว่าชุดข้อมูลมีลักษณะอย่างไร
การวัดทางสถิติอื่นๆ ที่มักถูกคำนวณเช่นกันคือการวัดแนวโน้มจากศูนย์กลางและการวัดตำแหน่ง โดยทั่วไปแล้ว จะไม่มีการกำหนดการวัดทางสถิติเพียงครั้งเดียว แต่จะต้องใช้การวัดหลายครั้งเพื่อให้เข้าใจได้ดีขึ้นว่าข้อมูลที่กำลังศึกษามีลักษณะเป็นอย่างไร