R'de nokta tahminleri nasıl hesaplanır (örneklerle)


Nokta tahmini, bir popülasyon parametresini tahmin etmek için örnek verilerden hesapladığımız bir sayıyı temsil eder. Bu, gerçek popülasyon parametresinin ne olabileceğine dair mümkün olan en iyi tahminimizdir.

Aşağıdaki tablo popülasyon parametrelerini tahmin etmek için kullandığımız nokta tahminini göstermektedir:

Ölçüm Nüfus parametresi Nokta tahmini
Anlam μ (nüfus ortalaması) x (örnek ortalama)
Oran π (nüfus oranı) p (örnek oranı)

Aşağıdaki örnekler, R’deki popülasyon ortalaması ve popülasyon oranı için nokta tahminlerinin nasıl hesaplanacağını göstermektedir.

Örnek 1: Popülasyon ortalamasının nokta tahmini

Belirli bir tarladaki belirli bir bitki türünün ortalama yüksekliğini (inç cinsinden) tahmin etmek istediğimizi varsayalım. 13 bitkiden oluşan basit rastgele bir örnek topluyoruz ve her bitkinin yüksekliğini ölçüyoruz.

Aşağıdaki kod örnek ortalamanın nasıl hesaplanacağını gösterir:

 #define data
data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24)

#calculate sample mean
mean(data, na. rm = TRUE )

[1] 15.61538

Örnek ortalama 15,6 inçtir. Bu, nüfus ortalamasına ilişkin nokta tahminimizi temsil eder.

Popülasyon ortalaması için %95 güven aralığını hesaplamak amacıyla aşağıdaki kodu da kullanabiliriz:

 #find sample size, sample mean, and sample standard deviation
n <- length(data)
xbar <- mean(data, na. rm = TRUE )
s <- sd(data)

#calculate margin of error
margin <- qt(0.975,df=n-1)*s/sqrt(n)

#calculate lower and upper bounds of confidence interval
low <- xbar - margin
low

[1] 12.03575

high <- xbar + margin
high

[1] 19.19502

Popülasyon ortalaması için %95 güven aralığı [12,0, 19,2] inçtir.

Örnek 2: Nüfus oranının nokta tahmini

Belirli bir şehirdeki belirli bir yasayı destekleyen insanların oranını tahmin etmek istediğimizi varsayalım. 20 vatandaştan oluşan basit rastgele bir örnekle röportaj yapıyoruz.

Aşağıdaki kod örnek oranının nasıl hesaplanacağını gösterir:

 #define data
data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y',
          'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N')

#find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == ' Y ') 

#find sample proportion
p <- k/n

p

[1] 0.6

Yasayı destekleyen vatandaşların örneklem oranı 0,6’dır . Bu, nüfus oranına ilişkin nokta tahminimizi temsil ediyor.

Popülasyon ortalaması için %95 güven aralığını hesaplamak amacıyla aşağıdaki kodu da kullanabiliriz:

 #find total sample size
n <- length(data)

#find number who responded 'Yes'
k <- sum(data == ' Y ') 

#find sample proportion
p <- k/n

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p*(1-p)/n)

#calculate lower and upper bounds of confidence interval
low <- p - margin
low

[1] 0.3852967

high <- p + margin
high

[1] 0.8147033

Nüfus oranı için %95 güven aralığı [0,39, 0,81]’ dir.

Ek kaynaklar

R’deki beş sayının özeti nasıl hesaplanır
R’de güven aralıkları nasıl bulunur?
R’de bir güven aralığı nasıl çizilir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir