R'de güven aralıkları nasıl bulunur (örneklerle)


Güven aralığı, belirli bir güven düzeyine sahip bir popülasyon parametresini içermesi muhtemel bir değer aralığıdır.

Aşağıdaki genel formüle göre hesaplanır:

Güven aralığı = (nokta tahmini) +/- (kritik değer)* (standart hata)

Bu formül, muhtemelen bir miktar güven düzeyine sahip bir popülasyon parametresi içeren, alt sınırı ve üst sınırı olan bir aralık oluşturur:

Güven aralığı = [alt sınır, üst sınır]

Bu eğitimde R’de aşağıdaki güven aralıklarının nasıl hesaplanacağı açıklanmaktadır:

1. Ortalama için güven aralığı

2. Ortalamalar arasındaki fark için güven aralığı

3. Bir orantı için güven aralığı

4. Oranlar arasındaki fark için güven aralığı

Hadi gidelim!

Örnek 1: Bir ortalama için güven aralığı

Bir ortalamanın güven aralığını hesaplamak için aşağıdaki formülü kullanırız:

Güven aralığı = x +/- t n-1, 1-α/2 *(s/√n)

Altın:

  • x : örnek ortalama
  • t: t-kritik değeri
  • s: numune standart sapması
  • n: örneklem büyüklüğü

Örnek: Aşağıdaki bilgileri içeren rastgele bir kaplumbağa örneği topladığımızı varsayalım:

  • Örneklem büyüklüğü n = 25
  • Ortalama numune ağırlığı x = 300
  • Örneklem standart sapması s = 18,5

Aşağıdaki kod, kaplumbağa popülasyonunun gerçek ortalama ağırlığı için %95 güven aralığının nasıl hesaplanacağını gösterir:

 #input sample size, sample mean, and sample standard deviation
n <- 25
xbar <- 300 
s <- 18.5

#calculate margin of error
margin <- qt(0.975,df=n-1)*s/sqrt(n)

#calculate lower and upper bounds of confidence interval
low <- xbar - margin
low

[1] 292.3636

high <- xbar + margin
high

[1] 307.6364

Gerçek ortalama kaplumbağa popülasyonu ağırlığı için %95 güven aralığı [292,36, 307,64]’ tür.

Örnek 2: Ortalamalar arasındaki fark için güven aralığı

Nüfus ortalamalarındaki farka ilişkin güven aralığını hesaplamak için aşağıdaki formülü kullanırız:

Güven aralığı = ( x 1x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))

Altın:

  • x 1 , x 2 : örnek 1’in ortalaması, örnek 2’nin ortalaması
  • t: güven düzeyine ve (n 1 + n 2 -2) serbestlik derecesine dayalı t-kritik değeri
  • sp 2 : birleştirilmiş varyans, şu şekilde hesaplanır: ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
  • t: t-kritik değeri
  • n 1 , n 2 : örneklem büyüklüğü 1, örneklem büyüklüğü 2

Örnek: İki farklı kaplumbağa türü arasındaki ortalama ağırlık farkını tahmin etmek istediğimizi varsayalım. Bu nedenle her popülasyondan rastgele 15 kaplumbağa örneği topluyoruz. Her numunenin özet verileri aşağıda verilmiştir:

Örnek 1:

  • x1 = 310
  • 1 = 18,5
  • n1 = 15

Örnek 2:

  • x2 = 300
  • s2 = 16,4
  • n2 = 15

Aşağıdaki kod, popülasyon ortalamalarındaki gerçek fark için %95 güven aralığının nasıl hesaplanacağını gösterir:

 #input sample size, sample mean, and sample standard deviation
n1 <- 15
xbar1 <- 310 
s1 <- 18.5

n2 <- 15
xbar2 <- 300
s2 <- 16.4

#calculate pooled variance
sp = ((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n2-2)

#calculate margin of error
margin <- qt(0.975,df=n1+n2-1)*sqrt(sp/n1 + sp/n2)

#calculate lower and upper bounds of confidence interval
low <- (xbar1-xbar2) - margin
low

[1] -3.055445

high <- (xbar1-xbar2) + margin
high

[1] 23.05544

Popülasyon ortalamaları arasındaki gerçek fark için %95 güven aralığı [-3,06, 23,06]’ dır.

Örnek 3: Bir orantı için güven aralığı

Bir orana ilişkin güven aralığını hesaplamak için aşağıdaki formülü kullanırız:

Güven aralığı = p +/- z*(√ p(1-p) / n )

Altın:

  • p: örnek oranı
  • z: seçilen z değeri
  • n: örneklem büyüklüğü

Örnek: Bir ilçede belirli bir yasayı destekleyen sakinlerin oranını tahmin etmek istediğimizi varsayalım. 100 sakinden rastgele bir örnek seçiyoruz ve onlara yasadaki konumlarının ne olduğunu soruyoruz. Sonuçlar burada:

  • Örneklem büyüklüğü n = 100
  • Kanun lehine oran p = 0,56

Aşağıdaki kod, yasayı destekleyen ülke çapında sakinlerin gerçek oranı için %95 güven aralığının nasıl hesaplanacağını gösterir:

 #input sample size and sample proportion
n <- 100
p <- .56

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p*(1-p)/n)

#calculate lower and upper bounds of confidence interval
low <- p - margin
low

[1] 0.4627099

high <- p + margin
high

[1] 0.6572901

Eyalet genelinde yasayı destekleyen sakinlerin gerçek oranı için %95 güven aralığı [0,463, 0,657]’ dir.

Örnek 4: Oranlardaki fark için güven aralığı

Oranlardaki farka ilişkin güven aralığını hesaplamak için aşağıdaki formülü kullanırız:

Güven aralığı = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )

Altın:

  • p 1 , p 2 : 1. numunenin oranı, 2. numunenin oranı
  • z: güven düzeyine dayalı z-kritik değeri
  • n 1 , n 2 : örneklem büyüklüğü 1, örneklem büyüklüğü 2

Örnek: A İlçesinde belirli bir yasayı destekleyen sakinlerin oranı ile B İlçesinde yasayı destekleyen sakinlerin oranı arasındaki farkı tahmin etmek istediğimizi varsayalım. Her örnek için özet veriler aşağıda verilmiştir:

Örnek 1:

  • n1 = 100
  • p 1 = 0,62 (yani 100 kişiden 62’si yasayı destekliyor)

Örnek 2:

  • n2 = 100
  • p 2 = 0,46 (yani 100 kişiden 46’sı yasayı destekliyor)

Aşağıdaki kod, ilçeler arasında yasayı destekleyen sakinlerin oranındaki gerçek fark için %95 güven aralığının nasıl hesaplanacağını gösterir:

 #input sample sizes and sample proportions
n1 <- 100
p1 <- .62

n2 <- 100
p2 <- .46

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p1*(1-p1)/n1 + p2*(1-p2)/n2)

#calculate lower and upper bounds of confidence interval
low <- (p1-p2) - margin
low

[1] 0.02364509


high <- (p1-p2) + margin
high

[1] 0.2963549

İlçeler arasında yasayı destekleyen sakinlerin oranındaki gerçek fark için %95 güven aralığı [0,024, 0,296]’ dır.

Daha fazla R eğitimini burada bulabilirsiniz.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir