มาตรการวัดความแปรปรวน
บทความนี้จะอธิบายว่าการวัดความแปรปรวนคืออะไร และการวัดทางสถิติประเภทนี้ใช้เพื่ออะไร ดังนั้น คุณจะพบคำจำกัดความของการวัดความแปรปรวน การวัดความแปรปรวนประเภทต่างๆ มีอะไรบ้าง และวิธีการคำนวณการวัดความแปรปรวน
มาตรการวัดความแปรปรวนคืออะไร?
การวัดความแปรปรวน คือการวัดทางสถิติที่บ่งบอกถึงความแปรปรวนของชุดข้อมูล กล่าวอีกนัยหนึ่ง การวัดความแปรปรวนจะวัดการกระจายตัวของชุดข้อมูล
ดังนั้นจึงใช้มาตรการความแปรปรวนเพื่อทราบการกระจายตัวของค่าในตัวอย่าง ยิ่งค่าของการวัดความแปรปรวนมีค่าสูง หมายความว่าข้อมูลในตัวอย่างอยู่ห่างจากกันมากขึ้น โดยทั่วไป สิ่งสำคัญคือตัวอย่างข้อมูลจะต้องอยู่ใกล้กัน ดังนั้นเราจึงพยายามลดการวัดความแปรปรวนให้เหลือน้อยที่สุด
ในทางสถิติ การวัดความแปรปรวนมีความสำคัญเนื่องจากทำให้เราทราบถึงความเป็นตัวแทนของ การวัดการรวมศูนย์ บนชุดข้อมูล หากค่าของการวัดความแปรปรวนต่ำ แสดงว่าข้อมูลมีความเข้มข้นมาก ดังนั้น การวัดแบบรวมศูนย์จึงอธิบายข้อมูลทั้งหมดได้ดี
การวัดความแปรปรวนอาจเรียกอีกอย่างว่า การวัดการกระจาย หรือ การวัดการแพร่กระจาย
อะไรคือการวัดความแปรปรวน?
มาตรการความแปรปรวน มีดังนี้:
- ส่วนเบี่ยงเบนมาตรฐาน (หรือส่วนเบี่ยงเบนมาตรฐาน)
- ความแปรปรวน
- ค่าสัมประสิทธิ์ของการแปรผัน
- เรียบร้อย
- พิสัยระหว่างควอไทล์
- ความแตกต่างปานกลาง
ข้อมูลต่อไปนี้จะอธิบายวิธีคำนวณการวัดความแปรปรวนแต่ละประเภท
ส่วนเบี่ยงเบนมาตรฐาน
ค่าเบี่ยงเบนมาตรฐาน หรือที่เรียกว่า ค่าเบี่ยงเบนทั่วไป มีค่าเท่ากับรากที่สองของผลรวมของกำลังสองของการเบี่ยงเบนของชุดข้อมูลหารด้วยจำนวนการสังเกตทั้งหมด
ดังนั้นสูตรสำหรับการวัดความแปรปรวนจึงเป็นดังนี้:
ความแปรปรวน
ความแปรปรวน เท่ากับผลรวมของกำลังสองของส่วนที่เหลือต่อจำนวนการสังเกตทั้งหมด สูตรสำหรับการวัดความแปรปรวนนี้จึงเป็นดังนี้:
ทอง:
-
คือตัวแปรสุ่มที่คุณต้องการคำนวณความแปรปรวน
-
คือค่าข้อมูล
.
-
คือจำนวนการสังเกตทั้งหมด
-
คือค่าเฉลี่ยของตัวแปรสุ่ม
.
ค่าสัมประสิทธิ์ของการแปรผัน
ในสถิติ ค่าสัมประสิทธิ์ของการแปรผัน คือการวัดความแปรปรวนที่ใช้ในการกำหนดการกระจายตัวของชุดข้อมูลที่สัมพันธ์กับค่าเฉลี่ย ค่าสัมประสิทธิ์ของการแปรผันคำนวณโดยการหารค่าเบี่ยงเบนมาตรฐานของข้อมูลด้วยค่าเฉลี่ย จากนั้นคูณด้วย 100 เพื่อแสดงค่าเป็นเปอร์เซ็นต์
เรียบร้อย
ช่วง คือการวัดความแปรปรวนที่ระบุความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของข้อมูลในตัวอย่าง ดังนั้น ในการคำนวณขอบเขตของประชากรหรือตัวอย่างทางสถิติ ค่าสูงสุดจะต้องลบออกจากค่าต่ำสุด
พิสัยระหว่างควอไทล์
ช่วงระหว่างควอไทล์ หรือที่เรียกว่า ช่วงระหว่างควอไทล์ เป็นหน่วยวัดความแปรปรวนทางสถิติที่ระบุความแตกต่างระหว่างควอร์ไทล์ที่ 3 และควอไทล์ที่ 1
ดังนั้น ในการคำนวณช่วงระหว่างควอร์ไทล์ของชุดข้อมูลทางสถิติ คุณต้องค้นหาควอไทล์ที่สามและควอไทล์ที่หนึ่งก่อนแล้วจึงลบออก
สัญลักษณ์ของพิสัยระหว่างควอไทล์คือ IQR ซึ่งมาจาก พิสัยระหว่างควอไทล์ ภาษาอังกฤษ
คุณลักษณะที่ได้เปรียบที่สุดประการหนึ่งของการวัดความแปรปรวนนี้คือเป็นสถิติที่แข็งแกร่ง กล่าวคือ มีความคงทนสูงสำหรับค่าผิดปกติ เนื่องจากค่าสุดขั้วไม่ได้ถูกนำมาพิจารณาในการคำนวณช่วงระหว่างควอไทล์ ค่าของมันจะเปลี่ยนแปลงน้อยมากหากมี ค่าผิดปกติ ใหม่ปรากฏขึ้น
ความแตกต่างปานกลาง
ค่าเฉลี่ยส่วนเบี่ยงเบน หรือที่เรียกว่า ค่าเฉลี่ยส่วนเบี่ยงเบนสัมบูรณ์ คือค่าเฉลี่ยของการเบี่ยงเบนสัมบูรณ์ ค่าเบี่ยงเบนเฉลี่ยจึงเท่ากับผลรวมของการเบี่ยงเบนของแต่ละรายการข้อมูลจากค่าเฉลี่ยเลขคณิตหารด้วยจำนวนรายการข้อมูลทั้งหมด