วิธีการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยใน r


ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย เป็นวิธีการวัดการกระจายของค่าในชุดข้อมูล มีการคำนวณดังนี้:

ข้อผิดพลาดมาตรฐาน = s / √n

ทอง:

  • s : ค่าเบี่ยงเบนมาตรฐานตัวอย่าง
  • n : ขนาดตัวอย่าง

บทช่วยสอนนี้จะอธิบายสองวิธีที่คุณสามารถใช้คำนวณข้อผิดพลาดมาตรฐานของชุดข้อมูลใน R

วิธีที่ 1: ใช้ไลบรารี Plotrix

วิธีแรกในการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยคือการใช้ฟังก์ชัน std.error() ในตัวของไลบรารี Plotrix

รหัสต่อไปนี้แสดงวิธีใช้ฟังก์ชันนี้:

 library (plotrix)

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยกลายเป็น 2.001447

วิธีที่ 2: กำหนดฟังก์ชันของคุณเอง

อีกวิธีหนึ่งในการคำนวณค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยของชุดข้อมูลก็คือเพียงกำหนดฟังก์ชันของคุณเอง

รหัสต่อไปนี้แสดงวิธีการทำเช่นนี้:

 #define standard error of mean function
std.error <- function (x) sd(x)/sqrt( length (x))

#define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calculate standard error of the mean 
std.error(data)

2.001447

อีกครั้ง ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยกลายเป็น 2.0014

วิธีตีความความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย

ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยเป็นเพียงการวัดการแพร่กระจายของค่ารอบค่าเฉลี่ย

มีสองสิ่งที่ต้องคำนึงถึงเมื่อตีความค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย:

1. ยิ่งค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยมากเท่าใด ค่าที่กระจายอยู่รอบๆ ค่าเฉลี่ยในชุดข้อมูลก็จะยิ่งมากขึ้นเท่านั้น

เพื่ออธิบายสิ่งนี้ ให้พิจารณาว่าเราเปลี่ยนค่าสุดท้ายของชุดข้อมูลก่อนหน้าด้วยจำนวนที่มากกว่ามากหรือไม่:

 #define dataset
data <- c(3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150)

#calculate standard error of the mean 
std.error(data)

6.978265

สังเกตว่าข้อผิดพลาดมาตรฐานเพิ่มขึ้นจาก 2.001447 เป็น 6.978265 อย่างไร

สิ่งนี้บ่งชี้ว่าค่าในชุดข้อมูลนี้มีการกระจายตามค่าเฉลี่ยมากกว่าเมื่อเทียบกับชุดข้อมูลก่อนหน้า

2. เมื่อขนาดตัวอย่างเพิ่มขึ้น ความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยมีแนวโน้มลดลง

เพื่ออธิบายสิ่งนี้ ให้พิจารณาความคลาดเคลื่อนมาตรฐานของค่าเฉลี่ยสำหรับข้อมูลสองชุดต่อไปนี้:

 #define first dataset and find SEM
data1 <- c(1, 2, 3, 4, 5)
std.error(data1)

0.7071068

#define second dataset and find SEM
data2 <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5)
std.error(data2)

0.4714045

ชุดข้อมูลที่สองเป็นเพียงชุดข้อมูลชุดแรกที่ถูกทำซ้ำสองครั้ง

ดังนั้นชุดข้อมูลทั้งสองชุดจึงมีค่าเฉลี่ยเท่ากัน แต่ชุดข้อมูลชุดที่สองมีขนาดตัวอย่างที่ใหญ่กว่า จึงมีข้อผิดพลาดมาตรฐานน้อยกว่า

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการงานทั่วไปอื่นๆ ใน R:

วิธีการคำนวณตัวอย่างและความแปรปรวนของประชากรใน R
วิธีการคำนวณผลต่างรวมใน R
วิธีการคำนวณค่าสัมประสิทธิ์ของการแปรผันของ R

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *