R'de eşleştirilmiş örnekler t testi nasıl yapılır


Eşleştirilmiş örnekler t-testi, bir örnekteki her gözlemin diğer örnekteki bir gözlemle eşleştirilebildiği durumlarda iki örneğin ortalamalarını karşılaştıran istatistiksel bir testtir.

Örneğin, belirli bir müfredatın öğrencilerin belirli bir sınavdaki performansı üzerinde önemli bir etkisinin olup olmadığını bilmek istediğimizi varsayalım. Bunu test etmek için bir sınıftaki 20 öğrenciden ön test yapmalarını istiyoruz. Daha sonra öğrencilerin her biri iki hafta boyunca her gün çalışma programına katılır. Daha sonra öğrenciler benzer zorluktaki bir testi tekrar alırlar.

Birinci ve ikinci testteki ortalama puanlar arasındaki farkı karşılaştırmak için eşleştirilmiş t testi kullanıyoruz çünkü her öğrencinin ilk testteki puanı, ikinci testteki puanıyla ilişkilendirilebilir.

Eşleştirilmiş t testi nasıl yapılır

Eşleştirilmiş bir t testi gerçekleştirmek için aşağıdaki yaklaşımı kullanabiliriz:

Adım 1: Boş ve alternatif hipotezleri belirtin.

H 0 : μ d = 0

H a : μ d ≠ 0 (iki taraflı)
H a : μ d > 0 (tek taraflı)
H a : μ d < 0 (tek taraflı)

μ d ortalama farktır.

Adım 2: Test istatistiğini ve karşılık gelen p değerini bulun.

a = öğrencinin birinci testteki puanı ve b = öğrencinin ikinci testteki puanı olsun. Test puanları arasındaki gerçek ortalama farkın sıfır olduğuna ilişkin boş hipotezi test etmek için:

  • Her bir puan çifti arasındaki farkı hesaplayın (d i = b i – a i )
  • Ortalama farkı hesaplayın (d)
  • Farkların standart sapmasını hesaplayın s d
  • T = d / (s d / √n) olan t istatistiğini hesaplayın
  • n-1 serbestlik derecesine sahip t istatistiği için karşılık gelen p değerini bulun.

Adım 3: Anlamlılık düzeyine bağlı olarak boş hipotezi reddedin veya reddetmeyin.

P değeri seçilen anlamlılık düzeyinden küçükse, boş hipotezi reddederiz ve iki grubun ortalamaları arasında istatistiksel olarak anlamlı bir fark olduğu sonucuna varırız. Aksi halde sıfır hipotezini reddetmede başarısız oluruz.

R’de eşleştirilmiş t testi nasıl yapılır

R’de eşleştirilmiş bir t testi gerçekleştirmek için yerleşik t.test() işlevini aşağıdaki sözdizimiyle kullanabiliriz:

t.test (x, y, eşleştirilmiş = DOĞRU, alternatif = “iki taraf”)

  • x,y: karşılaştırmak istediğimiz iki dijital vektör
  • eşleştirilmiş: eşleştirilmiş bir t testi hesaplamak istediğimizi belirten mantıksal bir değer
  • alternatif: alternatif hipotez. Bu, “çift taraflı” (varsayılan), “üst” veya “alt” olarak ayarlanabilir.

Aşağıdaki örnek, 20 öğrenci için ön test ve son test arasında ortalama puanlar arasında anlamlı bir fark olup olmadığını belirlemek için eşleştirilmiş t testinin nasıl gerçekleştirileceğini göstermektedir.

Verileri oluşturun

Öncelikle veri setimizi oluşturacağız:

 #create the dataset
data <- data.frame(score = c(85,85, 78, 78, 92, 94, 91, 85, 72, 97,
                             84, 95, 99, 80, 90, 88, 95, 90, 96, 89,
                             84, 88, 88, 90, 92, 93, 91, 85, 80, 93,
                             97, 100, 93, 91, 90, 87, 94, 83, 92, 95),
                   group = c(rep('pre', 20), rep('post', 20)))

#view the dataset
data

#scoregroup
#1 85 pre
#2 85 pre
#3 78 pre
#4 78 pre
#5 92 pre
#6 94 pre
#7 91 pre
#8 85 pre
#9 72 pre
#10 97 pre
#11 84 pre
#12 95 pre
#13 99 pre
#14 80 pre
#15 90 pre
#16 88 pre
#17 95 pre
#18 90 pre
#19 96 pre
#20 89 pre
#21 84 post
#22 88 post
#23 88 post
#24 90 post
#25 92 post
#26 93 post
#27 91 post
#28 85 post
#29 80 post
#30 93 post
#31 97 post
#32 100 posts
#33 93 post
#34 91 post
#35 90 post
#36 87 post
#37 94 post
#38 83 post
#39 92 post
#40 95 post

Farklılıkları görselleştirin

Daha sonra, dplyr kütüphanesindeki group_by() ve Summary () işlevlerini kullanan iki grubun özet istatistiklerine bakacağız:

 #load dplyr library
library(dplyr)

#find sample size, mean, and standard deviation for each group
data %>%
group_by (group) %>%
  summarize (
    count = n(),
    mean = mean(score),
    sd = sd(score)
  )

# A tibble: 2 x 4
# group count mean sd
#     
#1 post 20 90.3 4.88
#2 pre 20 88.2 7.24

Ayrıca ön ve son gruplara ait puanların dağılımını görüntülemek için R’deki boxplot() işlevini kullanarak kutu grafikleri oluşturabiliriz:

 boxplot (score~group,
  data=data,
  main="Test Scores by Group",
  xlab="Group",
  ylab="Score",
  col="steelblue",
  border="black"
)

Özet istatistiklerden ve kutu grafiklerinden, post gruptaki ortalama puanın, ön gruptaki ortalama puandan biraz daha yüksek olduğunu görebiliriz. Ayrıca grup sonrası puanların, grup öncesi puanlara göre daha az değişkenliğe sahip olduğunu da görebiliriz.

Bu iki grubun ortalamaları arasındaki farkın istatistiksel olarak anlamlı olup olmadığını bulmak için eşleştirilmiş t testi yapabiliriz.

Eşleştirilmiş bir t testi gerçekleştirin

Eşleştirilmiş t testini gerçekleştirmeden önce, farkların dağılımının normal (veya yaklaşık olarak normal) dağıldığını doğrulamamız gerekir. Bunu yapmak için ön ve son puanlar arasındaki fark olarak tanımlanan yeni bir vektör oluşturabilir ve bu değer vektörü üzerinde normallik için bir Shapiro-Wilk testi uygulayabiliriz:

 #define new vector for difference between post and pre scores
differences <- with(data, score[group == "post"] - score[group == "pre"])

#perform shapiro-wilk test for normality on this vector of values
shapiro.test(differences)

# Shapiro-Wilk normality test
#
#data: differences
#W = 0.92307, p-value = 0.1135
#

Testin p değeri 0,1135 olup alfa = 0,05’ten büyüktür. Bu nedenle verilerimizin normal dağıldığı yönündeki sıfır hipotezini reddetmiyoruz. Bu artık eşleştirilmiş t-testine geçebileceğimiz anlamına gelir.

Eşleştirilmiş bir t testi gerçekleştirmek için aşağıdaki kodu kullanabiliriz:

 t.test (score~group, data = data, paired = TRUE)

# Paired t-test
#
#data: score by group
#t = 1.588, df = 19, p-value = 0.1288
#alternative hypothesis: true difference in means is not equal to 0
#95 percent confidence interval:
# -0.6837307 4.9837307
#sample estimates:
#mean of the differences 
#2.15 

Sonuçtan şunu görebiliriz:

  • T- testi istatistiği 1,588’dir .
  • 19 serbestlik derecesine (df) sahip bu test istatistiğinin p değeri 0,1288’dir .
  • Ortalama fark için %95 güven aralığı (-0,6837, 4,9837)’ dir.
  • Ön ve son grubun puanları arasındaki ortalama fark 2,15’tir .

Dolayısıyla, p-değerimiz 0,05 anlamlılık seviyemizin altında olduğundan, iki grubun istatistiksel olarak anlamlı ortalamalara sahip olduğu boş hipotezini reddetmede başarısız olacağız.

Başka bir deyişle, öncesi ve sonrası gruplar arasındaki ortalama puanların istatistiksel olarak farklı olduğunu söyleyecek yeterli kanıtımız yok. Bu, müfredatın test puanları üzerinde anlamlı bir etkisinin olmadığı anlamına gelir.

Ek olarak %95 güven aralığımız, iki grup arasındaki gerçek ortalama farkın -0,6837 ile 4,9837 arasında olduğundan “%95 emin” olduğumuzu gösterir.

Sıfır değeri bu güven aralığının içinde yer aldığından bu, sıfırın aslında ortalama puanlar arasındaki gerçek fark olabileceği anlamına gelir; bu durumda sıfır hipotezini reddetmemizin nedeni budur.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir