Eşit olmayan örneklem boyutlarıyla t testi nasıl yapılır?


İstatistik söz konusu olduğunda öğrencilerin sıklıkla sorduğu bir soru şudur:

Her grubun örneklem büyüklükleri eşit olmadığında t testi yapmak mümkün müdür?

Kısa cevap:

Evet, örneklem büyüklükleri eşit olmadığında t testi yapabilirsiniz. Eşit örneklem büyüklüğü, t-testinde yapılan varsayımlardan biri değildir.

Gerçek problemler, t-testinde yapılan varsayımlardan biri olan iki numunenin varyansları eşit olmadığında ortaya çıkar.

Böyle bir durum meydana geldiğinde, eşit varyansları varsaymayan Welch t testinin kullanılması önerilir.

Aşağıdaki örnekler, varyansların eşit olduğu ve olmadığı durumlarda eşit olmayan örneklem büyüklükleriyle T testlerinin nasıl gerçekleştirileceğini göstermektedir.

Örnek 1: Eşit olmayan örneklem boyutları ve eşit varyanslar

Öğrencilerin belirli sınavlarda daha iyi performans göstermelerine yardımcı olmak için tasarlanmış iki program yönettiğimizi varsayalım.

Sonuçlar aşağıdaki gibidir:

Program 1:

  • n (örneklem büyüklüğü): 500
  • x (örnek ortalama): 80
  • s (örnek standart sapması): 5

Program 2:

  • n (örneklem büyüklüğü): 20
  • x (örnek ortalama): 85
  • s (örnek standart sapması): 5

Aşağıdaki kod, her program için sınav puanlarının dağılımını görselleştirmek için R’de bir kutu grafiğinin nasıl oluşturulacağını gösterir:

 #make this example reproducible
set. seeds (1)

#create vectors to hold exam scores
program1 <- rnorm(500, mean=80, sd=5)
program2 <- rnorm(20, mean=85, sd=5)

#create boxplots to visualize distribution of exam scores
boxplot(program1, program2, names=c(" Program 1 "," Program 2 "))

Program 2’nin ortalama sınav puanı daha yüksek görünmektedir ancak iki program arasındaki sınav puanları arasındaki fark yaklaşık olarak eşittir.

Aşağıdaki kod, Welch t testiyle bağımsız örnekler t testinin nasıl gerçekleştirileceğini gösterir:

 #perform independent samples t-test
t. test (program1, program2, var. equal = TRUE )

	Two Sample t-test

data: program1 and program2
t = -3.3348, df = 518, p-value = 0.0009148
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -6.111504 -1.580245
sample estimates:
mean of x mean of y 
 80.11322 83.95910

#perform Welch's two sample t-test
t. test (program1, program2, var. equal = FALSE )

	Welch Two Sample t-test

data: program1 and program2
t = -3.3735, df = 20.589, p-value = 0.00293
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -6.219551 -1.472199
sample estimates:
mean of x mean of y 
 80.11322 83.95910 

Bağımsız örnekler t-testi 0,0009’luk bir p-değeri döndürür ve Welch’in t-testi 0,0029’luk bir p-değeri döndürür.

Her testin p değeri 0,05’ten küçük olduğundan, her testteki sıfır hipotezini reddeder ve iki program arasında ortalama sınav puanlarında istatistiksel olarak anlamlı bir fark olduğu sonucuna varırız.

Örneklem boyutları eşit olmasa da, bağımsız örnekler t-testi ve Welch t-testi, iki örneğin eşit varyanslara sahip olması nedeniyle benzer sonuçlar vermektedir.

Örnek 2: Eşit olmayan örneklem boyutları ve eşit olmayan varyanslar

Öğrencilerin belirli sınavlarda daha iyi performans göstermelerine yardımcı olmak için tasarlanmış iki program yönettiğimizi varsayalım.

Sonuçlar aşağıdaki gibidir:

Program 1:

  • n (örneklem büyüklüğü): 500
  • x (örnek ortalama): 80
  • s (örnek standart sapması): 25

Program 2:

  • n (örneklem büyüklüğü): 20
  • x (örnek ortalama): 85
  • s (örnek standart sapması): 5

Aşağıdaki kod, her program için sınav puanlarının dağılımını görselleştirmek için R’de bir kutu grafiğinin nasıl oluşturulacağını gösterir:

 #make this example reproducible
set. seeds (1)

#create vectors to hold exam scores
program1 <- rnorm(500, mean=80, sd=25)
program2 <- rnorm(20, mean=85, sd=5)

#create boxplots to visualize distribution of exam scores
boxplot(program1, program2, names=c(" Program 1 "," Program 2 "))

Program 2’nin ortalama sınav puanı daha yüksek görünmektedir, ancak Program 1’in sınav puanlarının varyansı Program 2’den çok daha yüksektir.

Aşağıdaki kod, Welch t testiyle bağımsız örnekler t testinin nasıl gerçekleştirileceğini gösterir:

 #perform independent samples t-test
t. test (program1, program2, var. equal = TRUE )

	Two Sample t-test

data: program1 and program2
t = -0.5988, df = 518, p-value = 0.5496
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -14.52474 7.73875
sample estimates:
mean of x mean of y 
  80.5661 83.9591

#perform Welch's two sample t-test
t. test (program1, program2, var. equal = FALSE )

	Welch Two Sample t-test

data: program1 and program2
t = -2.1338, df = 74.934, p-value = 0.03613
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -6.560690 -0.225296
sample estimates:
mean of x mean of y 
  80.5661 83.9591 

Bağımsız örnekler t-testi 0,5496’lık bir p-değeri verir ve Welch’in t-testi 0,0361’lik bir p-değeri verir.

Bağımsız örnekler t testi ortalama sınav puanlarındaki farkı tespit edemez ancak Welch t testi istatistiksel olarak anlamlı bir fark tespit edebilir.

İki numunenin varyansları eşit olmadığından, bu test numuneler arasındaki varyansların eşit olduğunu varsaymadığından yalnızca Welch’in t testi ortalama sınav puanlarındaki istatistiksel olarak anlamlı farkı tespit edebildi .

Ek kaynaklar

Aşağıdaki eğitimler t testleri hakkında ek bilgi sağlar:

Tek örnekli t testine giriş
İki örnekli t testine giriş
Eşleştirilmiş örnekler t-testine giriş

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir