Python'da hipotez testi nasıl yapılır (örneklerle)


Hipotez testi, istatistiksel bir hipotezi reddetmek veya reddetmek için kullandığımız resmi bir istatistiksel testtir.

Bu eğitimde Python’da aşağıdaki hipotez testlerinin nasıl gerçekleştirileceği açıklanmaktadır:

  • Örnek bir t testi
  • İki örnekli T testi
  • Eşleştirilmiş örnekler t testi

Hadi gidelim!

Örnek 1: Python’da bir t-testi örneği

Tek örnekli t testi, bir popülasyonun ortalamasının belirli bir değere eşit olup olmadığını test etmek için kullanılır.

Örneğin, belirli bir kaplumbağa türünün ortalama ağırlığının 310 pound olup olmadığını bilmek istediğimizi varsayalım.

Bunu test etmek için aşağıdaki ağırlıklara sahip basit ve rastgele bir kaplumbağa örneği topluyoruz:

Ağırlık : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303

Aşağıdaki kod, tek örnekli bir t testi gerçekleştirmek için scipy.stats kitaplığında ttest_1samp() işlevinin nasıl kullanılacağını gösterir:

 import scipy.stats as stats

#define data
data = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303]

#perform one sample t-test
stats. ttest_1samp (a=data, popmean= 310 )

Ttest_1sampResult(statistic=-1.5848116313861254, pvalue=0.1389944275158753)

T testi istatistiği -1,5848’dir ve karşılık gelen iki kuyruklu p değeri 0,1389’dur .

Belirli bir örnek üzerindeki bu t-testi için iki hipotez aşağıdaki gibidir:

  • H 0 : µ = 310 (Bu kaplumbağa türünün ortalama ağırlığı 310 pounddur)
  • H A : µ ≠310 (ortalama ağırlık 310 pound değildir )

Testimizin p değeri (0,1389) alfa = 0,05’ten büyük olduğundan, testin sıfır hipotezini reddedemiyoruz.

Bu özel kaplumbağa türünün ortalama ağırlığının 310 pounddan başka bir şey olduğunu söyleyecek yeterli kanıtımız yok.

Örnek 2: Python’da iki örnekli t testi

İki örneklem t testi, iki popülasyonun ortalamalarının eşit olup olmadığını test etmek için kullanılır.

Örneğin iki farklı kaplumbağa türünün ortalama ağırlığının eşit olup olmadığını bilmek istediğimizi varsayalım.

Bunu test etmek için her türden aşağıdaki ağırlıklara sahip basit ve rastgele bir kaplumbağa örneği topluyoruz:

Örnek 1 : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303

Örnek 2 : 335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305

Aşağıdaki kod, bu iki t testi örneğini gerçekleştirmek için scipy.stats kitaplığında ttest_ind() işlevinin nasıl kullanılacağını gösterir:

 import scipy. stats as stats

#define array of turtle weights for each sample
sample1 = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303]
sample2 = [335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305]

#perform two sample t-tests
stats. ttest_ind (a=sample1, b=sample2) 

Ttest_indResult(statistic=-2.1009029257555696, pvalue=0.04633501389516516)

T testi istatistiği –2,1009’dur ve karşılık gelen iki kuyruklu p değeri 0,0463’tür .

Bu özel iki örnekli t testi için iki varsayım şunlardır:

  • H 0 : µ 1 = µ 2 (iki tür arasındaki ortalama ağırlık eşittir)
  • H A : µ 1 ≠ µ 2 (iki tür arasındaki ortalama ağırlık eşit değildir)

Testin p değeri (0,0463) 0,05’ten küçük olduğundan sıfır hipotezini reddediyoruz.

Bu, iki tür arasındaki ortalama ağırlığın eşit olmadığını söyleyecek yeterli kanıtımız olduğu anlamına geliyor.

Örnek 3: Python’da Eşleştirilmiş Örnekler t-testi

Eşleştirilmiş örnekler t-testi, bir örnekteki her gözlemin diğer örnekteki bir gözlemle ilişkilendirilebildiği durumlarda iki örneğin ortalamalarını karşılaştırmak için kullanılır.

Örneğin, belirli bir antrenman programının basketbolcuların maksimum dikey sıçramasını (inç cinsinden) artırma kapasitesine sahip olup olmadığını bilmek istediğimizi varsayalım.

Bunu test etmek için, 12 kolej basketbol oyuncusundan oluşan basit rastgele bir örnek alabilir ve onların maksimum dikey sıçramalarının her birini ölçebiliriz. Daha sonra her oyuncunun bir ay boyunca antrenman programını kullanmasını sağlayabiliriz ve ay sonunda maksimum dikey sıçramalarını tekrar ölçebiliriz.

Aşağıdaki veriler, her oyuncunun antrenman programını kullanmadan önceki ve sonraki maksimum atlama yüksekliğini (inç cinsinden) gösterir:

Ön : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21

Sonra : 23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20

Aşağıdaki kod, bu eşleştirilmiş örnekler t testini gerçekleştirmek için scipy.stats kitaplığında ttest_rel() işlevinin nasıl kullanılacağını gösterir:

 import scipy. stats as stats

#define before and after max jump heights
before = [22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21]
after = [23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20]

#perform paired samples t-test
stats. ttest_rel (a=before, b=after)

Ttest_relResult(statistic=-2.5289026942943655, pvalue=0.02802807458682508)

T testi istatistiği –2,5289’dur ve karşılık gelen iki kuyruklu p değeri 0,0280’dir .

Bu özel eşleştirilmiş örnekler t-testi için iki varsayım şunlardır:

  • H 0 : µ 1 = µ 2 (programı kullanmadan önceki ve sonraki atlamanın ortalama yüksekliği eşittir)
  • H A : µ 1 ≠ µ 2 (programı kullanmadan önceki ve sonraki atlamanın ortalama yüksekliği eşit değildir)

Testin p değeri (0,0280) 0,05’ten küçük olduğundan sıfır hipotezini reddediyoruz.

Bu, antrenman programını kullanmadan önceki ve sonraki ortalama atlama yüksekliğinin eşit olmadığını söyleyecek yeterli kanıtımız olduğu anlamına gelir.

Ek kaynaklar

Çeşitli t-testlerini otomatik olarak gerçekleştirmek için aşağıdaki çevrimiçi hesap makinelerini kullanabilirsiniz:

Bir t-testi hesap makinesi örneği
İki örnekli t testi hesaplayıcısı
Eşleştirilmiş Örnekler t-Testi Hesaplayıcı

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir