มาตรการวัดความแปรปรวน

บทความนี้จะอธิบายว่าการวัดความแปรปรวนคืออะไร และการวัดทางสถิติประเภทนี้ใช้เพื่ออะไร ดังนั้น คุณจะพบคำจำกัดความของการวัดความแปรปรวน การวัดความแปรปรวนประเภทต่างๆ มีอะไรบ้าง และวิธีการคำนวณการวัดความแปรปรวน

มาตรการวัดความแปรปรวนคืออะไร?

การวัดความแปรปรวน คือการวัดทางสถิติที่บ่งบอกถึงความแปรปรวนของชุดข้อมูล กล่าวอีกนัยหนึ่ง การวัดความแปรปรวนจะวัดการกระจายตัวของชุดข้อมูล

ดังนั้นจึงใช้มาตรการความแปรปรวนเพื่อทราบการกระจายตัวของค่าในตัวอย่าง ยิ่งค่าของการวัดความแปรปรวนมีค่าสูง หมายความว่าข้อมูลในตัวอย่างอยู่ห่างจากกันมากขึ้น โดยทั่วไป สิ่งสำคัญคือตัวอย่างข้อมูลจะต้องอยู่ใกล้กัน ดังนั้นเราจึงพยายามลดการวัดความแปรปรวนให้เหลือน้อยที่สุด

ในทางสถิติ การวัดความแปรปรวนมีความสำคัญเนื่องจากทำให้เราทราบถึงความเป็นตัวแทนของ การวัดการรวมศูนย์ บนชุดข้อมูล หากค่าของการวัดความแปรปรวนต่ำ แสดงว่าข้อมูลมีความเข้มข้นมาก ดังนั้น การวัดแบบรวมศูนย์จึงอธิบายข้อมูลทั้งหมดได้ดี

การวัดความแปรปรวนอาจเรียกอีกอย่างว่า การวัดการกระจาย หรือ การวัดการแพร่กระจาย

อะไรคือการวัดความแปรปรวน?

มาตรการความแปรปรวน มีดังนี้:

  • ส่วนเบี่ยงเบนมาตรฐาน (หรือส่วนเบี่ยงเบนมาตรฐาน)
  • ความแปรปรวน
  • ค่าสัมประสิทธิ์ของการแปรผัน
  • เรียบร้อย
  • พิสัยระหว่างควอไทล์
  • ความแตกต่างปานกลาง

ข้อมูลต่อไปนี้จะอธิบายวิธีคำนวณการวัดความแปรปรวนแต่ละประเภท

ส่วนเบี่ยงเบนมาตรฐาน

ค่าเบี่ยงเบนมาตรฐาน หรือที่เรียกว่า ค่าเบี่ยงเบนทั่วไป มีค่าเท่ากับรากที่สองของผลรวมของกำลังสองของการเบี่ยงเบนของชุดข้อมูลหารด้วยจำนวนการสังเกตทั้งหมด

ดังนั้นสูตรสำหรับการวัดความแปรปรวนจึงเป็นดังนี้:

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^N(x_i-\overline{x})^2}{N}}

ความแปรปรวน

ความแปรปรวน เท่ากับผลรวมของกำลังสองของส่วนที่เหลือต่อจำนวนการสังเกตทั้งหมด สูตรสำหรับการวัดความแปรปรวนนี้จึงเป็นดังนี้:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

ทอง:

  • X

    คือตัวแปรสุ่มที่คุณต้องการคำนวณความแปรปรวน

  • x_i

    คือค่าข้อมูล

    i

    .

  • n

    คือจำนวนการสังเกตทั้งหมด

  • \overline{X}

    คือค่าเฉลี่ยของตัวแปรสุ่ม

    X

    .

ค่าสัมประสิทธิ์ของการแปรผัน

ในสถิติ ค่าสัมประสิทธิ์ของการแปรผัน คือการวัดความแปรปรวนที่ใช้ในการกำหนดการกระจายตัวของชุดข้อมูลที่สัมพันธ์กับค่าเฉลี่ย ค่าสัมประสิทธิ์ของการแปรผันคำนวณโดยการหารค่าเบี่ยงเบนมาตรฐานของข้อมูลด้วยค่าเฉลี่ย จากนั้นคูณด้วย 100 เพื่อแสดงค่าเป็นเปอร์เซ็นต์

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

เรียบร้อย

ช่วง คือการวัดความแปรปรวนที่ระบุความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของข้อมูลในตัวอย่าง ดังนั้น ในการคำนวณขอบเขตของประชากรหรือตัวอย่างทางสถิติ ค่าสูงสุดจะต้องลบออกจากค่าต่ำสุด

R=\text{M\'ax}-\text{M\'in}

พิสัยระหว่างควอไทล์

ช่วงระหว่างควอไทล์ หรือที่เรียกว่า ช่วงระหว่างควอไทล์ เป็นหน่วยวัดความแปรปรวนทางสถิติที่ระบุความแตกต่างระหว่างควอร์ไทล์ที่ 3 และควอไทล์ที่ 1

ดังนั้น ในการคำนวณช่วงระหว่างควอร์ไทล์ของชุดข้อมูลทางสถิติ คุณต้องค้นหาควอไทล์ที่สามและควอไทล์ที่หนึ่งก่อนแล้วจึงลบออก

IQR=Q_3-Q_1

สัญลักษณ์ของพิสัยระหว่างควอไทล์คือ IQR ซึ่งมาจาก พิสัยระหว่างควอไทล์ ภาษาอังกฤษ

คุณลักษณะที่ได้เปรียบที่สุดประการหนึ่งของการวัดความแปรปรวนนี้คือเป็นสถิติที่แข็งแกร่ง กล่าวคือ มีความคงทนสูงสำหรับค่าผิดปกติ เนื่องจากค่าสุดขั้วไม่ได้ถูกนำมาพิจารณาในการคำนวณช่วงระหว่างควอไทล์ ค่าของมันจะเปลี่ยนแปลงน้อยมากหากมี ค่าผิดปกติ ใหม่ปรากฏขึ้น

ความแตกต่างปานกลาง

ค่าเฉลี่ยส่วนเบี่ยงเบน หรือที่เรียกว่า ค่าเฉลี่ยส่วนเบี่ยงเบนสัมบูรณ์ คือค่าเฉลี่ยของการเบี่ยงเบนสัมบูรณ์ ค่าเบี่ยงเบนเฉลี่ยจึงเท่ากับผลรวมของการเบี่ยงเบนของแต่ละรายการข้อมูลจากค่าเฉลี่ยเลขคณิตหารด้วยจำนวนรายการข้อมูลทั้งหมด

D_{\overline{x}}=\cfrac{\sum_{i=1}^N|x_i-\overline{x}|}{N}

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *