Tam kılavuz: r'de hipotez testi


Hipotez testi, istatistiksel bir hipotezi reddetmek veya reddetmek için kullandığımız resmi bir istatistiksel testtir.

Bu eğitimde R’de aşağıdaki hipotez testlerinin nasıl gerçekleştirileceği açıklanmaktadır:

  • Örnek bir t testi
  • İki örnekli T testi
  • Eşleştirilmiş örnekler t testi

Her test türünü gerçekleştirmek için R’deki t.test() işlevini kullanabiliriz:

 #one sample t-test
t. test (x, y = NULL,
       alternative = c(" two.sided ", " less ", " greater "),
       mu = 0, paired = FALSE, var.equal = FALSE ,
       conf.level = 0.95, …)

Altın:

  • x, y: iki veri örneği.
  • alternatif: Testin alternatif hipotezi.
  • mu: Ortalamanın gerçek değeri.
  • eşleştirilmiş: eşleştirilmiş bir t testi gerçekleştirilip gerçekleştirilmeyeceği.
  • var.equal: örnekler arasındaki varyansların eşit olduğunun varsayılıp kabul edilmeyeceği.
  • conf.level: Kullanılacak güven düzeyi .

Aşağıdaki örnekler bu fonksiyonun pratikte nasıl kullanılacağını göstermektedir.

Örnek 1: R’de tek örnekli t testi

Tek örnekli t testi, bir popülasyonun ortalamasının belirli bir değere eşit olup olmadığını test etmek için kullanılır.

Örneğin, belirli bir kaplumbağa türünün ortalama ağırlığının 310 pound olup olmadığını bilmek istediğimizi varsayalım. Dışarı çıkıp aşağıdaki ağırlıklara sahip basit ve rastgele bir kaplumbağa örneği topluyoruz:

Ağırlık : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303

Aşağıdaki kod, bu t testi örneğinin R’de nasıl gerçekleştirileceğini gösterir:

 #define vector of turtle weights
turtle_weights <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303)

#perform one sample t-test
t. test (x=turtle_weights,mu=310)

	One Sample t-test

data: turtle_weights
t = -1.5848, df = 12, p-value = 0.139
alternative hypothesis: true mean is not equal to 310
95 percent confidence interval:
 303.4236 311.0379
sample estimates:
mean of x 
 307.2308

Sonuçtan şunu görebiliriz:

  • t-testi istatistiği: -1,5848
  • serbestlik derecesi: 12
  • p değeri: 0,139
  • Gerçek ortalama için %95 güven aralığı: [303.4236, 311.0379]
  • Kaplumbağaların ortalama ağırlığı: 307.230

Testin p değeri (0,139) 0,05’ten az olmadığından sıfır hipotezini reddedemiyoruz.

Bu, bu kaplumbağa türünün ortalama ağırlığının 310 pounddan başka bir şey olduğunu söyleyecek yeterli kanıtımız olmadığı anlamına geliyor.

Örnek 2: R’de iki örnekli t testi

İki örneklem t testi, iki popülasyonun ortalamalarının eşit olup olmadığını test etmek için kullanılır.

Örneğin iki farklı kaplumbağa türünün ortalama ağırlığının eşit olup olmadığını bilmek istediğimizi varsayalım. Bunu test etmek için her türden aşağıdaki ağırlıklara sahip basit ve rastgele bir kaplumbağa örneği topluyoruz:

Örnek 1 : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303

Örnek 2 : 335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305

Aşağıdaki kod, bu iki t testi örneğinin R’de nasıl gerçekleştirileceğini gösterir:

 #define vector of turtle weights for each sample
sample1 <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303)
sample2 <- c(335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305)

#perform two sample t-tests
t. test (x = sample1, y = sample2)

	Welch Two Sample t-test

data: sample1 and sample2
t = -2.1009, df = 19.112, p-value = 0.04914
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -14.73862953 -0.03060124
sample estimates:
mean of x mean of y 
 307.2308 314.6154

Sonuçtan şunu görebiliriz:

  • t-testi istatistiği: -2.1009
  • serbestlik derecesi: 19.112
  • p-değeri: 0,04914
  • Gerçek ortalama fark için %95 güven aralığı: [-14,74, -0,03]
  • 1. numunenin ortalama ağırlığı: 307.2308
  • 2. numunenin ortalama ağırlığı: 314.6154

Testin p değeri (0,04914) 0,05’ten küçük olduğundan sıfır hipotezini reddediyoruz.

Bu, iki tür arasındaki ortalama ağırlığın eşit olmadığını söyleyecek yeterli kanıtımız olduğu anlamına geliyor.

Örnek 3: R’de eşleştirilmiş örnekler t testi

Eşleştirilmiş örnekler t-testi, bir örnekteki her gözlemin diğer örnekteki bir gözlemle ilişkilendirilebildiği durumlarda iki örneğin ortalamalarını karşılaştırmak için kullanılır.

Örneğin, belirli bir antrenman programının basketbolcuların maksimum dikey sıçramasını (inç cinsinden) artırma kapasitesine sahip olup olmadığını bilmek istediğimizi varsayalım.

Bunu test etmek için, 12 kolej basketbol oyuncusundan oluşan basit rastgele bir örnek alabilir ve onların maksimum dikey sıçramalarının her birini ölçebiliriz. Daha sonra her oyuncunun bir ay boyunca antrenman programını kullanmasını sağlayabiliriz ve ay sonunda maksimum dikey sıçramalarını tekrar ölçebiliriz.

Aşağıdaki veriler, her oyuncunun antrenman programını kullanmadan önceki ve sonraki maksimum atlama yüksekliğini (inç cinsinden) gösterir:

Ön : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21

Sonra : 23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20

Aşağıdaki kod, bu eşleştirilmiş örnekler t testinin R’de nasıl gerçekleştirileceğini gösterir:

 #define before and after max jump heights
before <- c(22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21)
after <- c(23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20)

#perform paired samples t-test
t. test (x = before, y = after, paired = TRUE )

	Paired t-test

data: before and after
t = -2.5289, df = 11, p-value = 0.02803
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -2.3379151 -0.1620849
sample estimates:
mean of the differences 
                  -1.25

Sonuçtan şunları görebiliriz:

  • t-testi istatistiği: -2,5289
  • serbestlik derecesi: 11
  • p-değeri: 0,02803
  • Gerçek ortalama fark için %95 güven aralığı: [-2,34, -0,16]
  • Öncesi ve sonrası arasındaki ortalama fark: -1,25

Testin p değeri (0,02803) 0,05’ten küçük olduğundan sıfır hipotezini reddediyoruz.

Bu, antrenman programını kullanmadan önceki ve sonraki ortalama atlama yüksekliğinin eşit olmadığını söyleyecek yeterli kanıtımız olduğu anlamına gelir.

Ek kaynaklar

Çeşitli t testlerini otomatik olarak gerçekleştirmek için aşağıdaki çevrimiçi hesap makinelerini kullanın:

Bir t-testi hesap makinesi örneği
İki örnekli t testi hesaplayıcısı
Eşleştirilmiş Örnekler t-Testi Hesaplayıcı

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir