R'de nokta tahminleri nasıl hesaplanır (örneklerle)
Nokta tahmini, bir popülasyon parametresini tahmin etmek için örnek verilerden hesapladığımız bir sayıyı temsil eder. Bu, gerçek popülasyon parametresinin ne olabileceğine dair mümkün olan en iyi tahminimizdir.
Aşağıdaki tablo popülasyon parametrelerini tahmin etmek için kullandığımız nokta tahminini göstermektedir:
Ölçüm | Nüfus parametresi | Nokta tahmini |
---|---|---|
Anlam | μ (nüfus ortalaması) | x (örnek ortalama) |
Oran | π (nüfus oranı) | p (örnek oranı) |
Aşağıdaki örnekler, R’deki popülasyon ortalaması ve popülasyon oranı için nokta tahminlerinin nasıl hesaplanacağını göstermektedir.
Örnek 1: Popülasyon ortalamasının nokta tahmini
Belirli bir tarladaki belirli bir bitki türünün ortalama yüksekliğini (inç cinsinden) tahmin etmek istediğimizi varsayalım. 13 bitkiden oluşan basit rastgele bir örnek topluyoruz ve her bitkinin yüksekliğini ölçüyoruz.
Aşağıdaki kod örnek ortalamanın nasıl hesaplanacağını gösterir:
#define data data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24) #calculate sample mean mean(data, na. rm = TRUE ) [1] 15.61538
Örnek ortalama 15,6 inçtir. Bu, nüfus ortalamasına ilişkin nokta tahminimizi temsil eder.
Popülasyon ortalaması için %95 güven aralığını hesaplamak amacıyla aşağıdaki kodu da kullanabiliriz:
#find sample size, sample mean, and sample standard deviation n <- length(data) xbar <- mean(data, na. rm = TRUE ) s <- sd(data) #calculate margin of error margin <- qt(0.975,df=n-1)*s/sqrt(n) #calculate lower and upper bounds of confidence interval low <- xbar - margin low [1] 12.03575 high <- xbar + margin high [1] 19.19502
Popülasyon ortalaması için %95 güven aralığı [12,0, 19,2] inçtir.
Örnek 2: Nüfus oranının nokta tahmini
Belirli bir şehirdeki belirli bir yasayı destekleyen insanların oranını tahmin etmek istediğimizi varsayalım. 20 vatandaştan oluşan basit rastgele bir örnekle röportaj yapıyoruz.
Aşağıdaki kod örnek oranının nasıl hesaplanacağını gösterir:
#define data data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y', 'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N') #find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n p [1] 0.6
Yasayı destekleyen vatandaşların örneklem oranı 0,6’dır . Bu, nüfus oranına ilişkin nokta tahminimizi temsil ediyor.
Popülasyon ortalaması için %95 güven aralığını hesaplamak amacıyla aşağıdaki kodu da kullanabiliriz:
#find total sample size n <- length(data) #find number who responded 'Yes' k <- sum(data == ' Y ') #find sample proportion p <- k/n #calculate margin of error margin <- qnorm(0.975)*sqrt(p*(1-p)/n) #calculate lower and upper bounds of confidence interval low <- p - margin low [1] 0.3852967 high <- p + margin high [1] 0.8147033
Nüfus oranı için %95 güven aralığı [0,39, 0,81]’ dir.
Ek kaynaklar
R’deki beş sayının özeti nasıl hesaplanır
R’de güven aralıkları nasıl bulunur?
R’de bir güven aralığı nasıl çizilir