วิธีการคำนวณข้อผิดพลาดมาตรฐานของค่าเฉลี่ยใน python
ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย เป็นวิธีการวัดการกระจายของค่าในชุดข้อมูล มีการคำนวณดังนี้:
ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย = s / √n
ทอง:
- s : ค่าเบี่ยงเบนมาตรฐานตัวอย่าง
- n : ขนาดตัวอย่าง
บทช่วยสอนนี้จะอธิบายสองวิธีที่คุณสามารถใช้คำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยของชุดข้อมูลใน Python โปรดทราบว่าทั้งสองวิธีให้ผลลัพธ์ที่เหมือนกันทุกประการ
วิธีที่ 1: ใช้ SciPy
วิธีแรกในการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยคือการใช้ฟังก์ชัน sem() จากไลบรารี SciPy Stats
รหัสต่อไปนี้แสดงวิธีใช้ฟังก์ชันนี้:
from scipy. stats import week #define dataset data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29] #calculate standard error of the mean sem(data) 2.001447
ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยกลายเป็น 2.001447
วิธีที่ 2: ใช้ NumPy
อีกวิธีหนึ่งในการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยของชุดข้อมูลคือการใช้ฟังก์ชัน std() ของ NumPy
โปรดทราบว่าเราจำเป็นต้องระบุ ddof=1 ในอาร์กิวเมนต์ของฟังก์ชันนี้เพื่อคำนวณค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง ซึ่งตรงข้ามกับค่าเบี่ยงเบนมาตรฐานของประชากร
รหัสต่อไปนี้แสดงวิธีการทำเช่นนี้:
import numpy as np #define dataset data = np.array([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]) #calculate standard error of the mean n.p. std (data, ddof= 1 ) / np. sqrt ( np.size (data)) 2.001447
ขอย้ำอีกครั้งว่าค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยกลายเป็น 2.001447
วิธีตีความความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย
ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยเป็นเพียงการวัดการแพร่กระจายของค่ารอบค่าเฉลี่ย มีสองสิ่งที่ต้องคำนึงถึงเมื่อตีความค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย:
1. ยิ่งค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยมากเท่าใด ค่าที่กระจายอยู่รอบๆ ค่าเฉลี่ยในชุดข้อมูลก็จะยิ่งมากขึ้นเท่านั้น
เพื่ออธิบายสิ่งนี้ ให้พิจารณาว่าเราเปลี่ยนค่าสุดท้ายของชุดข้อมูลก่อนหน้าด้วยจำนวนที่มากกว่ามากหรือไม่:
from scipy. stats import week #define dataset data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 ] #calculate standard error of the mean sem(data) 6.978265
สังเกตว่าข้อผิดพลาดมาตรฐานเพิ่มขึ้นจาก 2.001447 เป็น 6.978265 อย่างไร สิ่งนี้บ่งชี้ว่าค่าในชุดข้อมูลนี้มีการกระจายตามค่าเฉลี่ยมากกว่าเมื่อเทียบกับชุดข้อมูลก่อนหน้า
2. เมื่อขนาดตัวอย่างเพิ่มขึ้น ความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยมีแนวโน้มลดลง
เพื่ออธิบายสิ่งนี้ ให้พิจารณาความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยสำหรับข้อมูลสองชุดต่อไปนี้:
from scipy . stats import week #define first dataset and find SEM data1 = [1, 2, 3, 4, 5] sem(data1) 0.7071068 #define second dataset and find SEM data2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5] sem(data2) 0.4714045
ชุดข้อมูลที่สองเป็นเพียงชุดข้อมูลชุดแรกที่ถูกทำซ้ำสองครั้ง ดังนั้นชุดข้อมูลทั้งสองชุดจึงมีค่าเฉลี่ยเท่ากัน แต่ชุดข้อมูลชุดที่สองมีขนาดตัวอย่างที่ใหญ่กว่า จึงมีข้อผิดพลาดมาตรฐานน้อยกว่า
แหล่งข้อมูลเพิ่มเติม
วิธีการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยใน R
วิธีการคำนวณข้อผิดพลาดมาตรฐานของค่าเฉลี่ยใน Excel
วิธีคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยใน Google ชีต