วิธีการคำนวณข้อผิดพลาดมาตรฐานของค่าเฉลี่ยใน python


ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย เป็นวิธีการวัดการกระจายของค่าในชุดข้อมูล มีการคำนวณดังนี้:

ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย = s / √n

ทอง:

  • s : ค่าเบี่ยงเบนมาตรฐานตัวอย่าง
  • n : ขนาดตัวอย่าง

บทช่วยสอนนี้จะอธิบายสองวิธีที่คุณสามารถใช้คำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยของชุดข้อมูลใน Python โปรดทราบว่าทั้งสองวิธีให้ผลลัพธ์ที่เหมือนกันทุกประการ

วิธีที่ 1: ใช้ SciPy

วิธีแรกในการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยคือการใช้ฟังก์ชัน sem() จากไลบรารี SciPy Stats

รหัสต่อไปนี้แสดงวิธีใช้ฟังก์ชันนี้:

 from scipy. stats import week

#define dataset 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]

#calculate standard error of the mean 
sem(data)

2.001447

ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยกลายเป็น 2.001447

วิธีที่ 2: ใช้ NumPy

อีกวิธีหนึ่งในการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยของชุดข้อมูลคือการใช้ฟังก์ชัน std() ของ NumPy

โปรดทราบว่าเราจำเป็นต้องระบุ ddof=1 ในอาร์กิวเมนต์ของฟังก์ชันนี้เพื่อคำนวณค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง ซึ่งตรงข้ามกับค่าเบี่ยงเบนมาตรฐานของประชากร

รหัสต่อไปนี้แสดงวิธีการทำเช่นนี้:

 import numpy as np

#define dataset
data = np.array([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29])

#calculate standard error of the mean 
n.p. std (data, ddof= 1 ) / np. sqrt ( np.size (data))

2.001447

ขอย้ำอีกครั้งว่าค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยกลายเป็น 2.001447

วิธีตีความความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย

ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยเป็นเพียงการวัดการแพร่กระจายของค่ารอบค่าเฉลี่ย มีสองสิ่งที่ต้องคำนึงถึงเมื่อตีความค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย:

1. ยิ่งค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยมากเท่าใด ค่าที่กระจายอยู่รอบๆ ค่าเฉลี่ยในชุดข้อมูลก็จะยิ่งมากขึ้นเท่านั้น

เพื่ออธิบายสิ่งนี้ ให้พิจารณาว่าเราเปลี่ยนค่าสุดท้ายของชุดข้อมูลก่อนหน้าด้วยจำนวนที่มากกว่ามากหรือไม่:

 from scipy. stats import week

#define dataset 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 ]

#calculate standard error of the mean 
sem(data)

6.978265

สังเกตว่าข้อผิดพลาดมาตรฐานเพิ่มขึ้นจาก 2.001447 เป็น 6.978265 อย่างไร สิ่งนี้บ่งชี้ว่าค่าในชุดข้อมูลนี้มีการกระจายตามค่าเฉลี่ยมากกว่าเมื่อเทียบกับชุดข้อมูลก่อนหน้า

2. เมื่อขนาดตัวอย่างเพิ่มขึ้น ความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยมีแนวโน้มลดลง

เพื่ออธิบายสิ่งนี้ ให้พิจารณาความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยสำหรับข้อมูลสองชุดต่อไปนี้:

 from scipy . stats import week 

#define first dataset and find SEM
data1 = [1, 2, 3, 4, 5]
sem(data1)

0.7071068

#define second dataset and find SEM
data2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5]
sem(data2)

0.4714045

ชุดข้อมูลที่สองเป็นเพียงชุดข้อมูลชุดแรกที่ถูกทำซ้ำสองครั้ง ดังนั้นชุดข้อมูลทั้งสองชุดจึงมีค่าเฉลี่ยเท่ากัน แต่ชุดข้อมูลชุดที่สองมีขนาดตัวอย่างที่ใหญ่กว่า จึงมีข้อผิดพลาดมาตรฐานน้อยกว่า

แหล่งข้อมูลเพิ่มเติม

วิธีการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยใน R
วิธีการคำนวณข้อผิดพลาดมาตรฐานของค่าเฉลี่ยใน Excel
วิธีคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยใน Google ชีต

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *