R'de güven aralıkları nasıl bulunur (örneklerle)
Güven aralığı, belirli bir güven düzeyine sahip bir popülasyon parametresini içermesi muhtemel bir değer aralığıdır.
Aşağıdaki genel formüle göre hesaplanır:
Güven aralığı = (nokta tahmini) +/- (kritik değer)* (standart hata)
Bu formül, muhtemelen bir miktar güven düzeyine sahip bir popülasyon parametresi içeren, alt sınırı ve üst sınırı olan bir aralık oluşturur:
Güven aralığı = [alt sınır, üst sınır]
Bu eğitimde R’de aşağıdaki güven aralıklarının nasıl hesaplanacağı açıklanmaktadır:
1. Ortalama için güven aralığı
2. Ortalamalar arasındaki fark için güven aralığı
3. Bir orantı için güven aralığı
4. Oranlar arasındaki fark için güven aralığı
Hadi gidelim!
Örnek 1: Bir ortalama için güven aralığı
Bir ortalamanın güven aralığını hesaplamak için aşağıdaki formülü kullanırız:
Güven aralığı = x +/- t n-1, 1-α/2 *(s/√n)
Altın:
- x : örnek ortalama
- t: t-kritik değeri
- s: numune standart sapması
- n: örneklem büyüklüğü
Örnek: Aşağıdaki bilgileri içeren rastgele bir kaplumbağa örneği topladığımızı varsayalım:
- Örneklem büyüklüğü n = 25
- Ortalama numune ağırlığı x = 300
- Örneklem standart sapması s = 18,5
Aşağıdaki kod, kaplumbağa popülasyonunun gerçek ortalama ağırlığı için %95 güven aralığının nasıl hesaplanacağını gösterir:
#input sample size, sample mean, and sample standard deviation n <- 25 xbar <- 300 s <- 18.5 #calculate margin of error margin <- qt(0.975,df=n-1)*s/sqrt(n) #calculate lower and upper bounds of confidence interval low <- xbar - margin low [1] 292.3636 high <- xbar + margin high [1] 307.6364
Gerçek ortalama kaplumbağa popülasyonu ağırlığı için %95 güven aralığı [292,36, 307,64]’ tür.
Örnek 2: Ortalamalar arasındaki fark için güven aralığı
Nüfus ortalamalarındaki farka ilişkin güven aralığını hesaplamak için aşağıdaki formülü kullanırız:
Güven aralığı = ( x 1 – x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))
Altın:
- x 1 , x 2 : örnek 1’in ortalaması, örnek 2’nin ortalaması
- t: güven düzeyine ve (n 1 + n 2 -2) serbestlik derecesine dayalı t-kritik değeri
- sp 2 : birleştirilmiş varyans, şu şekilde hesaplanır: ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
- t: t-kritik değeri
- n 1 , n 2 : örneklem büyüklüğü 1, örneklem büyüklüğü 2
Örnek: İki farklı kaplumbağa türü arasındaki ortalama ağırlık farkını tahmin etmek istediğimizi varsayalım. Bu nedenle her popülasyondan rastgele 15 kaplumbağa örneği topluyoruz. Her numunenin özet verileri aşağıda verilmiştir:
Örnek 1:
- x1 = 310
- 1 = 18,5
- n1 = 15
Örnek 2:
- x2 = 300
- s2 = 16,4
- n2 = 15
Aşağıdaki kod, popülasyon ortalamalarındaki gerçek fark için %95 güven aralığının nasıl hesaplanacağını gösterir:
#input sample size, sample mean, and sample standard deviation n1 <- 15 xbar1 <- 310 s1 <- 18.5 n2 <- 15 xbar2 <- 300 s2 <- 16.4 #calculate pooled variance sp = ((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n2-2) #calculate margin of error margin <- qt(0.975,df=n1+n2-1)*sqrt(sp/n1 + sp/n2) #calculate lower and upper bounds of confidence interval low <- (xbar1-xbar2) - margin low [1] -3.055445 high <- (xbar1-xbar2) + margin high [1] 23.05544
Popülasyon ortalamaları arasındaki gerçek fark için %95 güven aralığı [-3,06, 23,06]’ dır.
Örnek 3: Bir orantı için güven aralığı
Bir orana ilişkin güven aralığını hesaplamak için aşağıdaki formülü kullanırız:
Güven aralığı = p +/- z*(√ p(1-p) / n )
Altın:
- p: örnek oranı
- z: seçilen z değeri
- n: örneklem büyüklüğü
Örnek: Bir ilçede belirli bir yasayı destekleyen sakinlerin oranını tahmin etmek istediğimizi varsayalım. 100 sakinden rastgele bir örnek seçiyoruz ve onlara yasadaki konumlarının ne olduğunu soruyoruz. Sonuçlar burada:
- Örneklem büyüklüğü n = 100
- Kanun lehine oran p = 0,56
Aşağıdaki kod, yasayı destekleyen ülke çapında sakinlerin gerçek oranı için %95 güven aralığının nasıl hesaplanacağını gösterir:
#input sample size and sample proportion n <- 100 p <- .56 #calculate margin of error margin <- qnorm(0.975)*sqrt(p*(1-p)/n) #calculate lower and upper bounds of confidence interval low <- p - margin low [1] 0.4627099 high <- p + margin high [1] 0.6572901
Eyalet genelinde yasayı destekleyen sakinlerin gerçek oranı için %95 güven aralığı [0,463, 0,657]’ dir.
Örnek 4: Oranlardaki fark için güven aralığı
Oranlardaki farka ilişkin güven aralığını hesaplamak için aşağıdaki formülü kullanırız:
Güven aralığı = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )
Altın:
- p 1 , p 2 : 1. numunenin oranı, 2. numunenin oranı
- z: güven düzeyine dayalı z-kritik değeri
- n 1 , n 2 : örneklem büyüklüğü 1, örneklem büyüklüğü 2
Örnek: A İlçesinde belirli bir yasayı destekleyen sakinlerin oranı ile B İlçesinde yasayı destekleyen sakinlerin oranı arasındaki farkı tahmin etmek istediğimizi varsayalım. Her örnek için özet veriler aşağıda verilmiştir:
Örnek 1:
- n1 = 100
- p 1 = 0,62 (yani 100 kişiden 62’si yasayı destekliyor)
Örnek 2:
- n2 = 100
- p 2 = 0,46 (yani 100 kişiden 46’sı yasayı destekliyor)
Aşağıdaki kod, ilçeler arasında yasayı destekleyen sakinlerin oranındaki gerçek fark için %95 güven aralığının nasıl hesaplanacağını gösterir:
#input sample sizes and sample proportions n1 <- 100 p1 <- .62 n2 <- 100 p2 <- .46 #calculate margin of error margin <- qnorm(0.975)*sqrt(p1*(1-p1)/n1 + p2*(1-p2)/n2) #calculate lower and upper bounds of confidence interval low <- (p1-p2) - margin low [1] 0.02364509 high <- (p1-p2) + margin high [1] 0.2963549
İlçeler arasında yasayı destekleyen sakinlerin oranındaki gerçek fark için %95 güven aralığı [0,024, 0,296]’ dır.
Daha fazla R eğitimini burada bulabilirsiniz.