วิธีการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยใน r
ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย เป็นวิธีการวัดการกระจายของค่าในชุดข้อมูล มีการคำนวณดังนี้:
ข้อผิดพลาดมาตรฐาน = s / √n
ทอง:
- s : ค่าเบี่ยงเบนมาตรฐานตัวอย่าง
- n : ขนาดตัวอย่าง
บทช่วยสอนนี้จะอธิบายสองวิธีที่คุณสามารถใช้คำนวณข้อผิดพลาดมาตรฐานของชุดข้อมูลใน R
วิธีที่ 1: ใช้ไลบรารี Plotrix
วิธีแรกในการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยคือการใช้ฟังก์ชัน std.error() ในตัวของไลบรารี Plotrix
รหัสต่อไปนี้แสดงวิธีใช้ฟังก์ชันนี้:
library (plotrix) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยกลายเป็น 2.001447
วิธีที่ 2: กำหนดฟังก์ชันของคุณเอง
อีกวิธีหนึ่งในการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยของชุดข้อมูลก็คือเพียงกำหนดฟังก์ชันของคุณเอง
รหัสต่อไปนี้แสดงวิธีการทำเช่นนี้:
#define standard error of mean function std.error <- function (x) sd(x)/sqrt( length (x)) #define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29) #calculate standard error of the mean std.error(data) 2.001447
อีกครั้ง ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยกลายเป็น 2.0014
วิธีตีความความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย
ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยเป็นเพียงการวัดการแพร่กระจายของค่ารอบค่าเฉลี่ย
มีสองสิ่งที่ต้องคำนึงถึงเมื่อตีความค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย:
1. ยิ่งค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยมากเท่าใด ค่าที่กระจายอยู่รอบๆ ค่าเฉลี่ยในชุดข้อมูลก็จะยิ่งมากขึ้นเท่านั้น
เพื่ออธิบายสิ่งนี้ ให้พิจารณาว่าเราเปลี่ยนค่าสุดท้ายของชุดข้อมูลก่อนหน้าด้วยจำนวนที่มากกว่ามากหรือไม่:
#define dataset data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150) #calculate standard error of the mean std.error(data) 6.978265
สังเกตว่าข้อผิดพลาดมาตรฐานเพิ่มขึ้นจาก 2.001447 เป็น 6.978265 อย่างไร
สิ่งนี้บ่งชี้ว่าค่าในชุดข้อมูลนี้มีการกระจายตามค่าเฉลี่ยมากกว่าเมื่อเทียบกับชุดข้อมูลก่อนหน้า
2. เมื่อขนาดตัวอย่างเพิ่มขึ้น ความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยมีแนวโน้มลดลง
เพื่ออธิบายสิ่งนี้ ให้พิจารณาความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยสำหรับข้อมูลสองชุดต่อไปนี้:
#define first dataset and find SEM data1 <- c(1, 2, 3, 4, 5) std.error(data1) 0.7071068 #define second dataset and find SEM data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) std.error(data2) 0.4714045
ชุดข้อมูลที่สองเป็นเพียงชุดข้อมูลชุดแรกที่ถูกทำซ้ำสองครั้ง
ดังนั้นชุดข้อมูลทั้งสองชุดจึงมีค่าเฉลี่ยเท่ากัน แต่ชุดข้อมูลชุดที่สองมีขนาดตัวอย่างที่ใหญ่กว่า จึงมีข้อผิดพลาดมาตรฐานน้อยกว่า
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน R:
วิธีการคำนวณตัวอย่างและความแปรปรวนของประชากรใน R
วิธีการคำนวณผลต่างรวมใน R
วิธีการคำนวณค่าสัมประสิทธิ์ของการแปรผันของ R