วิธีการคำนวณการประมาณค่าจุดใน r (พร้อมตัวอย่าง)
การประมาณค่าจุด แสดงถึงตัวเลขที่เราคำนวณจากข้อมูลตัวอย่างเพื่อประมาณค่าพารามิเตอร์ประชากร นี่คือค่าประมาณที่ดีที่สุดที่เป็นไปได้ว่าพารามิเตอร์ประชากรจริงจะเป็นเท่าใด
ตารางต่อไปนี้แสดงการประมาณจุดที่เราใช้ประเมินพารามิเตอร์ประชากร:
การวัด | พารามิเตอร์ประชากร | การประมาณจุด |
---|---|---|
หมายถึง | μ (ค่าเฉลี่ยประชากร) | x (ค่าเฉลี่ยตัวอย่าง) |
สัดส่วน | π (สัดส่วนของประชากร) | p (สัดส่วนตัวอย่าง) |
ตัวอย่างต่อไปนี้สาธิตวิธีคำนวณค่าประมาณแบบจุดสำหรับค่าเฉลี่ยประชากรและสัดส่วนประชากรในหน่วย R
ตัวอย่างที่ 1: การประมาณค่าแบบจุดของค่าเฉลี่ยประชากร
สมมติว่าเราต้องการประมาณความสูงเฉลี่ย (เป็นนิ้ว) ของพืชบางชนิดในสาขาใดสาขาหนึ่ง เรารวบรวมตัวอย่างสุ่มง่ายๆ จากต้น 13 ต้น และวัดความสูงของต้นแต่ละต้น
รหัสต่อไปนี้แสดงวิธีการคำนวณค่าเฉลี่ยตัวอย่าง:
#define data data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24) #calculate sample mean mean(data, na. rm = TRUE ) [1] 15.61538
ค่าเฉลี่ยตัวอย่างคือ 15.6 นิ้ว นี่แสดงถึงค่าประมาณแบบจุดของค่าเฉลี่ยประชากร
นอกจากนี้เรายังสามารถใช้โค้ดต่อไปนี้เพื่อคำนวณช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยประชากร:
#find sample size, sample mean, and sample standard deviation n <- length(data) xbar <- mean(data, na. rm = TRUE ) s <- sd(data) #calculate margin of error margin <- qt(0.975,df=n-1)*s/sqrt(n) #calculate lower and upper bounds of confidence interval low <- xbar - margin low [1] 12.03575 high <- xbar + margin high [1] 19.19502
ช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยประชากรคือ [12.0, 19.2] นิ้ว
ตัวอย่างที่ 2: การประมาณสัดส่วนประชากรแบบจุด
สมมติว่าเราต้องการประมาณสัดส่วนของผู้คนในเมืองหนึ่งที่สนับสนุนกฎหมายบางอย่าง เราสัมภาษณ์กลุ่มตัวอย่างง่ายๆ จำนวน 20 คน
รหัสต่อไปนี้แสดงวิธีการคำนวณสัดส่วนตัวอย่าง:
#define data data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y', 'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N') #find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n p [1] 0.6
สัดส่วนของกลุ่มตัวอย่างพลเมืองที่สนับสนุนกฎหมายคือ 0.6 นี่แสดงถึงการประมาณสัดส่วนประชากรแบบจุดของเรา
นอกจากนี้เรายังสามารถใช้โค้ดต่อไปนี้เพื่อคำนวณช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยประชากร:
#find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n #calculate margin of error margin <- qnorm(0.975)*sqrt(p*(1-p)/n) #calculate lower and upper bounds of confidence interval low <- p - margin low [1] 0.3852967 high <- p + margin high [1] 0.8147033
ช่วงความเชื่อมั่น 95% สำหรับสัดส่วนประชากรคือ [0.39, 0.81]
แหล่งข้อมูลเพิ่มเติม
วิธีการคำนวณผลสรุปของตัวเลขห้าตัวใน R
วิธีค้นหาช่วงความเชื่อมั่นใน R
วิธีการพล็อตช่วงความเชื่อมั่นใน R