T testi ile anova arasındaki fark nedir?
Bu eğitimde t testi ile ANOVA arasındaki farkın yanı sıra her testin ne zaman kullanılacağı açıklanmaktadır.
T testi
İki grubun ortalamaları arasında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için t testi kullanılır. İki tür t testi vardır:
1. Bağımsız örnekler t-testi. Bu, iki grubun ortalamaları arasındaki farkı karşılaştırmak istediğimizde ve grupların birbirinden tamamen bağımsız olduğu durumlarda kullanılır.
Örneğin araştırmacılar, Diyet A’nın mı yoksa Diyet B’nin mi insanların daha fazla kilo vermesine yardımcı olduğunu bilmek isteyebilirler. Rastgele seçilmiş 100 kişi A diyetine atandı. Rastgele seçilmiş 100 kişi de B diyetine atandı. Üç ay sonra araştırmacılar her kişinin toplam kilo kaybını kaydediyor. İki grup arasındaki ortalama kilo kaybının önemli ölçüde farklı olup olmadığını belirlemek için araştırmacılar bağımsız bir örnek t-testi yapabilir.
2. Eşleştirilmiş örnekler t-testi . Bu, iki grubun ortalamaları arasındaki farkı karşılaştırmak istediğimizde ve bir gruptan gelen her gözlemin diğer gruptan bir gözlemle ilişkilendirilebildiği durumlarda kullanılır.
Mesela bir sınıftaki 20 öğrencinin sınava girdiğini, sonra belli bir kılavuzu okuyup tekrar sınava girdiğini varsayalım. Birinci ve ikinci test puanları arasındaki farkı karşılaştırmak için eşleştirilmiş t testi kullanıyoruz çünkü her öğrencinin ilk test puanı, ikinci test puanıyla ilişkilendirilebilir.
Bir t-testinin geçerli sonuçlar üretmesi için aşağıdaki varsayımların karşılanması gerekir:
- Rastgele: Her iki örnek için de veri toplamak amacıyla rastgele bir örnek veya rastgele deney kullanılmalıdır.
- Normal: Örnekleme dağılımı normal veya yaklaşık olarak normaldir.
Bu varsayımlar karşılanırsa, iki grubun ortalamaları arasındaki farkı test etmek için t testi kullanmak mümkündür.
ANOVA
Üç veya daha fazla grubun ortalamaları arasında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için ANOVA (varyans analizi) kullanılır. Pratikte en sık kullanılan ANOVA testleri tek yönlü ANOVA ve iki yönlü ANOVA’dır:
Tek Yönlü ANOVA: Grupların tek bir faktöre göre bölünebildiği durumlarda üç veya daha fazla grubun ortalamaları arasında istatistiksel olarak anlamlı bir fark olup olmadığını test etmek için kullanılır.
Örnek: 90 kişilik bir sınıfı rastgele 30 kişilik üç gruba ayırıyorsunuz. Her grup bir sınava hazırlanmak için bir ay boyunca farklı bir çalışma tekniği kullanıyor. Ay sonunda tüm öğrenciler aynı sınava girerler. Çalışma tekniğinin sınav puanları üzerinde etkisi olup olmadığını bilmek istiyorsunuz. Yani üç grubun ortalama puanları arasında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için tek yönlü bir ANOVA gerçekleştirirsiniz.
İki yönlü ANOVA: Gruplar iki faktöre bölünebildiğinde üç veya daha fazla grubun ortalamaları arasında istatistiksel olarak anlamlı bir fark olup olmadığını test etmek için kullanılır.
Örnek: Egzersiz düzeyinin (egzersiz yapmamak, hafif egzersiz yapmak, yoğun egzersiz yapmak) ve cinsiyetin (erkek, kadın) kilo kaybını etkileyip etkilemediğini belirlemek istiyorsunuz. Bu durumda, incelediğiniz iki faktör egzersiz ve cinsiyettir ve yanıt değişkeniniz kilo kaybıdır (pound cinsinden ölçülür). Egzersizin ve cinsiyetin kilo kaybını etkileyip etkilemediğini belirlemek ve egzersiz ile cinsiyet arasında kilo kaybında bir etkileşim olup olmadığını belirlemek için iki yönlü ANOVA gerçekleştirebilirsiniz.
Bir ANOVA’nın geçerli sonuçlar üretebilmesi için aşağıdaki varsayımların karşılanması gerekir:
- Normallik – incelediğimiz tüm popülasyonlar normal bir dağılım izler. Yani örneğin üç farklı öğrenci grubunun sınav puanlarını karşılaştırmak istiyorsak birinci grubun, ikinci grubun ve üçüncü grubun sınav puanlarının normal dağılması gerekir.
- Eşit varyans – her gruptaki popülasyon varyansları eşit veya yaklaşık olarak eşittir.
- Bağımsızlık : Her grubun gözlemleri birbirinden bağımsız olmalıdır. Genellikle rastgele bir tasarım bununla ilgilenir.
Bu varsayımlar karşılanırsa, üç veya daha fazla grubun ortalamaları arasındaki farkı test etmek için ANOVA’nın kullanılması mümkündür.
Her test arasındaki farkları anlayın
T testi ile ANOVA arasındaki temel fark, her iki testin de gruplar arasında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için test istatistiklerini nasıl hesapladığıdır.
Bağımsız örnekler t-testi aşağıdaki test istatistiğini kullanır:
test istatistiği t = [ ( x 1 – x 2 ) – d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )
burada x 1 ve x 2 , grup 1 ve 2 için örnek ortalamalardır, d , iki ortalama arasındaki varsayımsal farktır (genellikle sıfırdır), s 1 2 ve s 2 2 , grup 1 ve 2 için örnek varyanslardır ve n 1 ve n 2 sırasıyla grup 1 ve 2’nin örnek boyutlarıdır.
Eşleştirilmiş örnekler t testi aşağıdaki test istatistiğini kullanır:
test istatistiği t = d / (s d / √n)
burada d , iki grup arasındaki ortalama farktır, sd , farkların standart sapmasıdır ve n, her grup için örneklem büyüklüğüdür (her iki grubun da aynı örneklem büyüklüğüne sahip olacağını unutmayın).
ANOVA aşağıdaki test istatistiğini kullanır:
test istatistiği F = s 2 b / s 2 w
burada s 2 b örnekler arası varyanstır ve s 2 w örnek içi varyanstır.
Bir t-testi, iki grup arasındaki ortalama farkın, farkların genel standart sapmasına oranını ölçer. Bu oranın yeterince yüksek olması, iki grup arasında anlamlı bir fark olduğuna dair yeterli kanıttır.
ANOVA ise gruplar arasındaki varyansın grup içindeki varyansa oranını ölçer. T testi gibi, eğer bu oran yeterince yüksekse, üç grubun aynı ortalamaya sahip olmadığına dair yeterli kanıt sağlar.
T testi ile ANOVA arasındaki bir diğer önemli fark, t testinin bize iki grubun aynı ortalamaya sahip olup olmadığını söyleyebilmesidir. Öte yandan ANOVA bize üç grubun aynı ortalamaya sahip olup olmadığını söyler ancak hangi grupların birbirinden farklı ortalamalara sahip olduğunu bize açıkça söylemez.
Hangi grupların birbirinden farklı olduğunu bulmak için post hoc testler gerekli olacaktır.
Her testin ne zaman kullanılacağını anlayın
Uygulamada iki grubun ortalamalarını karşılaştırmak istediğimizde t testini kullanırız. Üç veya daha fazla grubun ortalamalarını karşılaştırmak istediğimizde ANOVA kullanırız.
Üç veya daha fazla grubun ortalamalarını karşılaştırmak için birden fazla t testi kullanmamamızın altında yatan neden, Tip I hata oranının anlaşılmasına dayanmaktadır. Diyelim ki üç grubun ortalamalarını karşılaştırmak istiyoruz : A grubu, B grubu ve C grubu. Aşağıdaki üç t-testini gerçekleştirmek isteyebilirsiniz:
- A grubu ile B grubu arasındaki ortalamalar arasındaki farkı karşılaştırmak için bir t testi
- A grubu ile C grubu arasındaki ortalamalar arasındaki farkı karşılaştırmak için bir t testi
- B grubu ile C grubu arasındaki ortalamalar arasındaki farkı karşılaştırmak için bir t testi
Her t-testi için, Tip I hata yapma şansımız vardır; bu, sıfır hipotezi gerçekten doğruyken reddetme olasılığımızdır. Bu olasılık genellikle %5’tir. Bu da birden fazla t testi yaptığımızda bu hata oranının arttığı anlamına geliyor. Örneğin:
- Tek bir t-testi ile Tip I hata yapma olasılığımız 1 – 0,95 = 0,05’tir .
- İki t testiyle Tip I hata yapma olasılığımız 1 – (0,95 2 ) = 0,0975’tir .
- İki t testiyle Tip I hata yapma olasılığımız 1 – (0,95 3 ) = 0,1427’dir .
Bu hata oranı kabul edilemeyecek kadar yüksektir. Neyse ki ANOVA bu hataları kontrol ederek Tip I hatanın yalnızca %5’te kalmasını sağlar. Bu, istatistiksel olarak anlamlı bir test sonucunun yalnızca çok sayıda test yaparak elde ettiğimiz bir sonuç değil, gerçekten anlamlı olduğundan daha emin olmamızı sağlar.
Dolayısıyla üç veya daha fazla grubun ortalamaları arasında fark olup olmadığını anlamak istediğimizde sonuçlarımızın istatistiksel olarak geçerli ve güvenilir olması için ANOVA kullanmamız gerekir.