การวัดการกระจายตัว

ในบทความนี้ คุณจะได้เรียนรู้ว่าการวัดการกระจายคืออะไร และตัวชี้วัดทางสถิติเหล่านี้นำไปใช้ทำอะไร นอกจากนี้ คุณยังดูได้ว่าแต่ละการวัดการกระจายมีการคำนวณอย่างไร

มาตรการการกระจายตัวคืออะไร?

การวัดการกระจายตัว เป็นการวัดทางสถิติที่ระบุการกระจายตัวของชุดข้อมูล กล่าวคือ มีการใช้มาตรการการกระจายตัวเพื่อประเมินระดับการกระจายตัวของข้อมูลในตัวอย่าง

มาตรการการกระจายเรียกอีกอย่างว่า มาตรการความแปรปรวน หรือ มาตรการการแพร่กระจาย

มาตรการกระจายตัวมีอะไรบ้าง?

มาตรการการกระจาย มีดังนี้:

  • ส่วนเบี่ยงเบนมาตรฐาน (หรือส่วนเบี่ยงเบนมาตรฐาน)
  • ความแปรปรวน
  • ค่าสัมประสิทธิ์ของการแปรผัน
  • เรียบร้อย
  • พิสัยระหว่างควอไทล์
  • ความแตกต่างปานกลาง

ข้อมูลต่อไปนี้จะอธิบายวิธีการกำหนดการวัดการกระจายแต่ละรายการ

ส่วนเบี่ยงเบนมาตรฐาน

ค่าเบี่ยงเบนมาตรฐาน หรือที่เรียกว่า ค่าเบี่ยงเบนทั่วไป มีค่าเท่ากับรากที่สองของผลรวมของกำลังสองของการเบี่ยงเบนของชุดข้อมูลหารด้วยจำนวนการสังเกตทั้งหมด

สูตรสำหรับการวัดการกระจายตัวจึงเป็นดังนี้:

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^N(x_i-\overline{x})^2}{N}}

ความแปรปรวน

ความแปรปรวน เท่ากับผลรวมของกำลังสองของส่วนที่เหลือต่อจำนวนการสังเกตทั้งหมด สูตรสำหรับการวัดการกระจายตัวจึงเป็นดังนี้:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

ทอง:

  • X

    คือตัวแปรสุ่มที่คุณต้องการคำนวณความแปรปรวน

  • x_i

    คือค่าข้อมูล

    i

    .

  • n

    คือจำนวนการสังเกตทั้งหมด

  • \overline{X}

    คือค่าเฉลี่ยของตัวแปรสุ่ม

    X

    .

ค่าสัมประสิทธิ์ของการแปรผัน

ในสถิติ ค่าสัมประสิทธิ์ของการแปรผัน คือการวัดการกระจายตัวที่ใช้ในการกำหนดการกระจายตัวของชุดข้อมูลที่สัมพันธ์กับค่าเฉลี่ย ค่าสัมประสิทธิ์ของการแปรผันคำนวณโดยการหารค่าเบี่ยงเบนมาตรฐานของข้อมูลด้วยค่าเฉลี่ย จากนั้นคูณด้วย 100 เพื่อแสดงค่าเป็นเปอร์เซ็นต์

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

เรียบร้อย

ช่วง คือการวัดการกระจายตัวที่ระบุความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของข้อมูลในตัวอย่าง ดังนั้น ในการคำนวณขอบเขตของประชากรหรือตัวอย่างทางสถิติ ค่าสูงสุดจะต้องลบออกจากค่าต่ำสุด

R=\text{M\'ax}-\text{M\'in}

พิสัยระหว่างควอไทล์

ช่วงระหว่างควอร์ไทล์ หรือที่เรียกว่า ช่วงระหว่างควอไทล์ เป็นหน่วยวัดการกระจายตัวทางสถิติที่ระบุความแตกต่างระหว่างควอร์ไทล์ที่ 3 และควอไทล์ที่ 1

ดังนั้น ในการคำนวณช่วงระหว่างควอร์ไทล์ของชุดข้อมูลทางสถิติ คุณต้องค้นหาควอไทล์ที่สามและควอไทล์ที่หนึ่งก่อนแล้วจึงลบออก

IQR=Q_3-Q_1

สัญลักษณ์ของพิสัยระหว่างควอไทล์คือ IQR ซึ่งมาจาก พิสัยระหว่างควอไทล์ ภาษาอังกฤษ

คุณลักษณะที่ได้เปรียบที่สุดอย่างหนึ่งของการวัดการกระจายตัวนี้คือเป็นสถิติที่แข็งแกร่ง กล่าวคือ มีความคงทนสูงสำหรับค่าผิดปกติ เนื่องจากค่าสุดขั้วไม่ได้ถูกนำมาพิจารณาในการคำนวณช่วงระหว่างควอไทล์ ค่าของมันจะเปลี่ยนแปลงน้อยมากหากมี ค่าผิดปกติ ใหม่ปรากฏขึ้น

ความแตกต่างปานกลาง

ค่าเฉลี่ยส่วนเบี่ยงเบน หรือที่เรียกว่า ค่าเฉลี่ยส่วนเบี่ยงเบนสัมบูรณ์ คือค่าเฉลี่ยของการเบี่ยงเบนสัมบูรณ์ ค่าเบี่ยงเบนเฉลี่ยจึงเท่ากับผลรวมของการเบี่ยงเบนของแต่ละรายการข้อมูลจากค่าเฉลี่ยเลขคณิตหารด้วยจำนวนรายการข้อมูลทั้งหมด

D_{\overline{x}}=\cfrac{\sum_{i=1}^N|x_i-\overline{x}|}{N}

การวัดการกระจายตัวใช้เพื่ออะไร?

การวัดการกระจายตัวใช้เพื่อประเมินการกระจายตัวของตัวอย่างทางสถิติ นั่นคือการวัดการกระจายช่วยให้เราสามารถวัดปริมาณการกระจายตัวของชุดข้อมูลและจากค่าที่ได้รับสามารถวิเคราะห์การกระจายตัวของตัวอย่างข้อมูลได้

มาตรการการกระจายมีการใช้กันอย่างแพร่หลายเนื่องจากช่วยอธิบายตัวอย่างข้อมูล การวัดการกระจายช่วยให้เข้าใจว่าชุดข้อมูลมีลักษณะอย่างไร

การวัดทางสถิติอื่นๆ ที่มักถูกคำนวณเช่นกันคือการวัดแนวโน้มจากศูนย์กลางและการวัดตำแหน่ง โดยทั่วไปแล้ว จะไม่มีการกำหนดการวัดทางสถิติเพียงครั้งเดียว แต่จะต้องใช้การวัดหลายครั้งเพื่อให้เข้าใจได้ดีขึ้นว่าข้อมูลที่กำลังศึกษามีลักษณะเป็นอย่างไร

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *