ข้อดีและข้อเสียของการใช้ค่าเบี่ยงเบนมาตรฐาน


ค่า เบี่ยงเบนมาตรฐาน ของชุดข้อมูลเป็นวิธีการวัดค่าเบี่ยงเบนทั่วไปของแต่ละค่าจากค่าเฉลี่ย

สูตรในการคำนวณค่าเบี่ยงเบนมาตรฐานตัวอย่างซึ่งเขียนว่า s คือ:

s = √ Σ(x i – x̄) 2 / (n – 1)

ทอง:

  • Σ : สัญลักษณ์ที่หมายถึง “ผลรวม”
  • x i : ค่า ที่ i ในชุดข้อมูล
  • : ตัวอย่างหมายถึง
  • n : ขนาดตัวอย่าง

มีข้อดีหลักสองประการในการใช้ค่าเบี่ยงเบนมาตรฐานเพื่ออธิบายการกระจายของค่าในชุดข้อมูล:

ข้อได้เปรียบ #1: ค่าเบี่ยงเบนมาตรฐานใช้การสังเกตทั้งหมดในชุดข้อมูลในการคำนวณ ในทางสถิติ โดยทั่วไปเรากล่าวว่าเป็นสิ่งที่ดีที่จะสามารถใช้การสังเกตทั้งหมดในชุดข้อมูลเพื่อทำการคำนวณ เนื่องจากเราใช้ “ข้อมูล” ที่เป็นไปได้ทั้งหมดที่มีอยู่ในชุดข้อมูล

ข้อดี #2: ค่าเบี่ยงเบนมาตรฐานสามารถตีความได้ง่าย ค่าเบี่ยงเบนมาตรฐานคือค่าเดียวที่ให้ความคิดที่ดีว่าการสังเกต “ทั่วไป” ในชุดข้อมูลนั้นอยู่ห่างจากค่าเฉลี่ยมากเพียงใด

อย่างไรก็ตาม การใช้ค่าเบี่ยงเบนมาตรฐานมีข้อเสียเปรียบที่สำคัญ:

ข้อเสีย #1: ค่าเบี่ยงเบนมาตรฐานอาจได้รับผลกระทบจากค่าผิดปกติ เมื่อมีค่าผิดปกติสุดขีดในชุดข้อมูล อาจทำให้ค่าเบี่ยงเบนมาตรฐานเพิ่มขึ้น และทำให้เข้าใจผิดเกี่ยวกับการกระจายค่าในชุดข้อมูล

ตัวอย่างต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับข้อดีและข้อเสียของการใช้ค่าเบี่ยงเบนมาตรฐาน

ข้อได้เปรียบ #1: ส่วนเบี่ยงเบนมาตรฐานใช้การสังเกตทั้งหมด

สมมติว่าเรามีชุดข้อมูลต่อไปนี้ที่แสดงการกระจายคะแนนสอบของนักเรียนในชั้นเรียน:

เรตติ้ง: 68, 70, 71, 75, 78, 82, 83, 83, 85, 90, 91, 91, 92

เราสามารถใช้เครื่องคิดเลขหรือซอฟต์แวร์ทางสถิติเพื่อค้นหาว่า ค่าเบี่ยงเบนมาตรฐานตัวอย่างของชุดข้อมูลนี้คือ 8.46

ข้อดีของการใช้ค่าเบี่ยงเบนมาตรฐานในตัวอย่างนี้ก็คือ เราใช้การสังเกตที่เป็นไปได้ทั้งหมดในชุดข้อมูลเพื่อค้นหา “การกระจายตัว” โดยทั่วไปของค่า

ในทางตรงกันข้าม เราสามารถใช้หน่วยวัดอื่น เช่น ช่วงระหว่างควอไทล์ เพื่อวัดการกระจายของค่าในชุดข้อมูลนี้

เราสามารถใช้เครื่องคิดเลขเพื่อหาว่า ช่วงระหว่างควอไทล์คือ 17.5 นี่แสดงถึงช่องว่างระหว่าง 50% ตรงกลางของค่าในชุดข้อมูล

ตอนนี้ สมมติว่าเราเปลี่ยนค่าต่ำสุดในชุดข้อมูลให้ต่ำกว่ามาก:

การให้คะแนน: 22, 70, 71, 75, 78, 82, 83, 83, 85, 90, 91, 91, 92

เราสามารถใช้เครื่องคิดเลขเพื่อหาว่า ค่าเบี่ยงเบนมาตรฐานตัวอย่างคือ 18.37

อย่างไรก็ตาม ช่วงระหว่างควอไทล์ยังคงอยู่ที่ 17.5 เนื่องจากค่าตรงกลาง 50% จะไม่ได้รับผลกระทบ

นี่แสดงให้เห็นว่าค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างคำนึงถึงการสังเกตทั้งหมดในชุดข้อมูลในการคำนวณ ซึ่งแตกต่างจากการวัดการกระจายตัวอื่นๆ

ข้อดี #2: ค่าเบี่ยงเบนมาตรฐานสามารถตีความได้ง่าย

นึกถึงชุดข้อมูลต่อไปนี้ที่แสดงการกระจายคะแนนสอบของนักเรียนในชั้นเรียน:

เรตติ้ง: 68, 70, 71, 75, 78, 82, 83, 83, 85, 90, 91, 91, 92

เราใช้เครื่องคิดเลขเพื่อค้นหาว่าค่าเบี่ยงเบนมาตรฐานตัวอย่างของชุดข้อมูลนี้คือ 8.46

ซึ่งตีความได้ง่ายเพราะหมายความง่ายๆ ว่าค่าเบี่ยงเบนของคะแนนสอบ “ทั่วไป” อยู่ที่ประมาณ 8.46 จากคะแนนสอบเฉลี่ย

ในทางกลับกัน การวัดการกระจายแบบอื่นๆ นั้นไม่ง่ายที่จะตีความ

ตัวอย่างเช่น ค่าสัมประสิทธิ์ของการแปรผัน เป็นอีกการวัดการกระจายตัวที่แสดงถึงอัตราส่วนของค่าเบี่ยงเบนมาตรฐานต่อค่าเฉลี่ยตัวอย่าง

ค่าสัมประสิทธิ์การเปลี่ยนแปลง: s/x̄

ในตัวอย่างนี้ คะแนนสอบเฉลี่ยคือ 81.46 ดังนั้นค่าสัมประสิทธิ์ความแปรผันจึงคำนวณได้ดังนี้ 8.46 / 81.46 = 0.104

นี่แสดงถึงอัตราส่วนของค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างต่อค่าเฉลี่ยของกลุ่มตัวอย่าง ซึ่งจะเป็นประโยชน์ในการเปรียบเทียบการกระจายตัวของค่าในชุดข้อมูลหลายชุด แต่การตีความว่าเป็นหน่วยเมตริกในตัวเองนั้นไม่ตรงไปตรงมามากนัก

ข้อเสีย #1: ค่าเบี่ยงเบนมาตรฐานอาจได้รับผลกระทบจากค่าผิดปกติ

สมมติว่าเรามีชุดข้อมูลต่อไปนี้ที่มีข้อมูลเงินเดือนสำหรับพนักงาน 10 คน (เป็นพันดอลลาร์) ในบริษัทหนึ่ง:

เงินเดือน: 44, 48, 57, 68, 70, 71, 73, 79, 84, 94

ตัวอย่างค่าเบี่ยงเบนมาตรฐานของเงินเดือนจะอยู่ที่ประมาณ 15.57

ตอนนี้ สมมติว่าเรามีชุดข้อมูลเดียวกัน แต่เงินเดือนสูงสุดจะสูงกว่า มาก :

เงินเดือน: 44, 48, 57, 68, 70, 71, 73, 79, 84, 895

ตัวอย่างค่าเบี่ยงเบนมาตรฐานของเงินเดือนในชุดข้อมูลนี้คือประมาณ 262.47

การรวมค่าผิดปกติสุดขั้วเพียงค่าเดียวจะทำให้ค่าเบี่ยงเบนมาตรฐานได้รับผลกระทบอย่างมาก และตอนนี้ทำให้เกิดแนวคิดที่เข้าใจผิดเกี่ยวกับการกระจายเงินเดือน “ทั่วไป”

หมายเหตุ : เมื่อมีค่าผิดปกติอยู่ในชุดข้อมูล ช่วงระหว่างควอร์ไทล์สามารถให้การวัดการกระจายตัวที่ดีกว่า เนื่องจากไม่ได้รับผลกระทบจากค่าผิดปกติ

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับการใช้ค่าเบี่ยงเบนมาตรฐานในสถิติ:

ช่วงระหว่างควอไทล์และส่วนเบี่ยงเบนมาตรฐาน: ความแตกต่าง
สัมประสิทธิ์ของการแปรผันกับส่วนเบี่ยงเบนมาตรฐาน: ความแตกต่าง
ประชากรเทียบกับ ตัวอย่างค่าเบี่ยงเบนมาตรฐาน: เมื่อใดควรใช้แต่ละรายการ

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *