Tam kılavuz: r'de hipotez testi
Hipotez testi, istatistiksel bir hipotezi reddetmek veya reddetmek için kullandığımız resmi bir istatistiksel testtir.
Bu eğitimde R’de aşağıdaki hipotez testlerinin nasıl gerçekleştirileceği açıklanmaktadır:
- Örnek bir t testi
- İki örnekli T testi
- Eşleştirilmiş örnekler t testi
Her test türünü gerçekleştirmek için R’deki t.test() işlevini kullanabiliriz:
#one sample t-test t. test (x, y = NULL, alternative = c(" two.sided ", " less ", " greater "), mu = 0, paired = FALSE, var.equal = FALSE , conf.level = 0.95, …)
Altın:
- x, y: iki veri örneği.
- alternatif: Testin alternatif hipotezi.
- mu: Ortalamanın gerçek değeri.
- eşleştirilmiş: eşleştirilmiş bir t testi gerçekleştirilip gerçekleştirilmeyeceği.
- var.equal: örnekler arasındaki varyansların eşit olduğunun varsayılıp kabul edilmeyeceği.
- conf.level: Kullanılacak güven düzeyi .
Aşağıdaki örnekler bu fonksiyonun pratikte nasıl kullanılacağını göstermektedir.
Örnek 1: R’de tek örnekli t testi
Tek örnekli t testi, bir popülasyonun ortalamasının belirli bir değere eşit olup olmadığını test etmek için kullanılır.
Örneğin, belirli bir kaplumbağa türünün ortalama ağırlığının 310 pound olup olmadığını bilmek istediğimizi varsayalım. Dışarı çıkıp aşağıdaki ağırlıklara sahip basit ve rastgele bir kaplumbağa örneği topluyoruz:
Ağırlık : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303
Aşağıdaki kod, bu t testi örneğinin R’de nasıl gerçekleştirileceğini gösterir:
#define vector of turtle weights turtle_weights <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303) #perform one sample t-test t. test (x=turtle_weights,mu=310) One Sample t-test data: turtle_weights t = -1.5848, df = 12, p-value = 0.139 alternative hypothesis: true mean is not equal to 310 95 percent confidence interval: 303.4236 311.0379 sample estimates: mean of x 307.2308
Sonuçtan şunu görebiliriz:
- t-testi istatistiği: -1,5848
- serbestlik derecesi: 12
- p değeri: 0,139
- Gerçek ortalama için %95 güven aralığı: [303.4236, 311.0379]
- Kaplumbağaların ortalama ağırlığı: 307.230
Testin p değeri (0,139) 0,05’ten az olmadığından sıfır hipotezini reddedemiyoruz.
Bu, bu kaplumbağa türünün ortalama ağırlığının 310 pounddan başka bir şey olduğunu söyleyecek yeterli kanıtımız olmadığı anlamına geliyor.
Örnek 2: R’de iki örnekli t testi
İki örneklem t testi, iki popülasyonun ortalamalarının eşit olup olmadığını test etmek için kullanılır.
Örneğin iki farklı kaplumbağa türünün ortalama ağırlığının eşit olup olmadığını bilmek istediğimizi varsayalım. Bunu test etmek için her türden aşağıdaki ağırlıklara sahip basit ve rastgele bir kaplumbağa örneği topluyoruz:
Örnek 1 : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303
Örnek 2 : 335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305
Aşağıdaki kod, bu iki t testi örneğinin R’de nasıl gerçekleştirileceğini gösterir:
#define vector of turtle weights for each sample sample1 <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303) sample2 <- c(335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305) #perform two sample t-tests t. test (x = sample1, y = sample2) Welch Two Sample t-test data: sample1 and sample2 t = -2.1009, df = 19.112, p-value = 0.04914 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -14.73862953 -0.03060124 sample estimates: mean of x mean of y 307.2308 314.6154
Sonuçtan şunu görebiliriz:
- t-testi istatistiği: -2.1009
- serbestlik derecesi: 19.112
- p-değeri: 0,04914
- Gerçek ortalama fark için %95 güven aralığı: [-14,74, -0,03]
- 1. numunenin ortalama ağırlığı: 307.2308
- 2. numunenin ortalama ağırlığı: 314.6154
Testin p değeri (0,04914) 0,05’ten küçük olduğundan sıfır hipotezini reddediyoruz.
Bu, iki tür arasındaki ortalama ağırlığın eşit olmadığını söyleyecek yeterli kanıtımız olduğu anlamına geliyor.
Örnek 3: R’de eşleştirilmiş örnekler t testi
Eşleştirilmiş örnekler t-testi, bir örnekteki her gözlemin diğer örnekteki bir gözlemle ilişkilendirilebildiği durumlarda iki örneğin ortalamalarını karşılaştırmak için kullanılır.
Örneğin, belirli bir antrenman programının basketbolcuların maksimum dikey sıçramasını (inç cinsinden) artırma kapasitesine sahip olup olmadığını bilmek istediğimizi varsayalım.
Bunu test etmek için, 12 kolej basketbol oyuncusundan oluşan basit rastgele bir örnek alabilir ve onların maksimum dikey sıçramalarının her birini ölçebiliriz. Daha sonra her oyuncunun bir ay boyunca antrenman programını kullanmasını sağlayabiliriz ve ay sonunda maksimum dikey sıçramalarını tekrar ölçebiliriz.
Aşağıdaki veriler, her oyuncunun antrenman programını kullanmadan önceki ve sonraki maksimum atlama yüksekliğini (inç cinsinden) gösterir:
Ön : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21
Sonra : 23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20
Aşağıdaki kod, bu eşleştirilmiş örnekler t testinin R’de nasıl gerçekleştirileceğini gösterir:
#define before and after max jump heights before <- c(22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21) after <- c(23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20) #perform paired samples t-test t. test (x = before, y = after, paired = TRUE ) Paired t-test data: before and after t = -2.5289, df = 11, p-value = 0.02803 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -2.3379151 -0.1620849 sample estimates: mean of the differences -1.25
Sonuçtan şunları görebiliriz:
- t-testi istatistiği: -2,5289
- serbestlik derecesi: 11
- p-değeri: 0,02803
- Gerçek ortalama fark için %95 güven aralığı: [-2,34, -0,16]
- Öncesi ve sonrası arasındaki ortalama fark: -1,25
Testin p değeri (0,02803) 0,05’ten küçük olduğundan sıfır hipotezini reddediyoruz.
Bu, antrenman programını kullanmadan önceki ve sonraki ortalama atlama yüksekliğinin eşit olmadığını söyleyecek yeterli kanıtımız olduğu anlamına gelir.
Ek kaynaklar
Çeşitli t testlerini otomatik olarak gerçekleştirmek için aşağıdaki çevrimiçi hesap makinelerini kullanın:
Bir t-testi hesap makinesi örneği
İki örnekli t testi hesaplayıcısı
Eşleştirilmiş Örnekler t-Testi Hesaplayıcı