T testinde formüle edilen dört hipotez
İki örneklem t testi, iki popülasyonun ortalamalarının eşit olup olmadığını test etmek için kullanılır.
Bu test türü verilerle ilgili aşağıdaki varsayımları yapar:
1. Bağımsızlık: Bir numunenin gözlemleri diğer numunenin gözlemlerinden bağımsızdır.
2. Normallik: Her iki örnek de yaklaşık olarak normal dağılıma sahiptir.
3. Varyansların homojenliği: İki örnek yaklaşık olarak aynı varyansa sahiptir.
4. Rastgele Örnekleme: Her iki örnek de rastgele örnekleme yöntemi kullanılarak elde edilmiştir.
Bu varsayımlardan bir veya daha fazlası ihlal edilirse, iki örnekli t testinin sonuçları güvenilmez ve hatta yanıltıcı olabilir.
Bu derste, her bir varsayımın açıklamasını, varsayımın karşılanıp karşılanmadığının nasıl belirleneceğini ve ihlal edilmesi durumunda ne yapılacağını açıklıyoruz.
Hipotez 1: Bağımsızlık
İki örnekli t testi, bir örnekteki gözlemlerin diğer örnekteki gözlemlerden bağımsız olduğunu varsayar.
Bu çok önemli bir varsayımdır, çünkü aynı bireyler her iki örnekte de görünüyorsa, o zaman örnekler arasındaki farklar hakkında çıkarımda bulunmak geçerli değildir.
Bu hipotez nasıl doğrulanır?
Bu varsayımı test etmenin en basit yolu, her gözlemin her örnekte yalnızca bir kez göründüğünü ve her örnekteki gözlemlerin rastgele örneklemeyle toplandığını doğrulamaktır.
Bu varsayıma uyulmazsa ne yapılmalı?
Bu varsayım karşılanmazsa iki örnekli t testi sonuçları tamamen geçersizdir. Bu senaryoda, rastgele örnekleme yöntemini kullanarak iki yeni numune toplamak ve bir numunedeki her bireyin diğer numuneye ait olmadığından emin olmak en iyisidir.
Hipotez 2: normallik
İki örnekli t testi, iki örneğin yaklaşık olarak normal dağıldığını varsayar.
Bu çok önemli bir varsayımdır çünkü eğer numuneler normal şekilde dağılmıyorsa, numuneler arasındaki farklar hakkında sonuca varmak için testteki p değerlerini kullanmak geçerli değildir.
Bu hipotez nasıl doğrulanır?
Örnek boyutları küçükse (n < 50), her örnek boyutunun normal şekilde dağılıp dağılmadığını belirlemek için Shapiro-Wilk testi kullanabiliriz. Testin p değeri belirli bir anlamlılık düzeyinin altındaysa veriler muhtemelen normal dağılmıyordur.
Örnek boyutları büyükse verilerin normal şekilde dağılıp dağılmadığını görsel olarak kontrol etmek için QQ grafiği kullanmak daha iyidir.
Veri noktaları bir QQ grafiğinde kabaca düz bir çapraz çizgi boyunca uzanıyorsa, o zaman veri seti muhtemelen normal bir dağılım izliyor demektir.
Bu varsayıma uyulmazsa ne yapılmalı?
Bu varsayımın ihlal edilmesi durumunda, iki örnekli t testinin parametrik olmayan eşdeğeri olarak kabul edilen ve iki örneğin normal dağıldığını varsaymayan Mann-Whitney U testi yapabiliriz.
Hipotez 3: Farklılıkların homojenliği
İki örnekli t testi, iki örneğin yaklaşık olarak eşit varyansa sahip olduğunu varsayar.
Bu hipotez nasıl doğrulanır?
İki örnek arasındaki varyansların eşit olup olmadığını belirlemek için aşağıdaki temel kuralı kullanırız: En büyük varyansın en küçük varyansa oranı 4’ten küçükse, varyansların yaklaşık olarak eşit olduğunu varsayabilir ve her iki örneği de kullanabiliriz. -Ölçek.
Örneğin, 1. numunenin varyansının 24.5 olduğunu ve 2. numunenin varyansının 15.2 olduğunu varsayalım. En büyük örnek varyansının en küçük örnek varyansına oranı şu şekilde hesaplanacaktır:
Oran: 24,5 / 15,2 = 1,61
Bu oranın 4’ten küçük olması nedeniyle iki grup arasındaki farkların yaklaşık olarak eşit olduğu varsayılabilir.
Bu varsayıma uyulmazsa ne yapılmalı?
Bu varsayım ihlal edilirse, iki örnekli t testinin parametrik olmayan bir versiyonu olan ve iki örneğin eşit varyansa sahip olduğunu varsaymayan Welch t testini uygulayabiliriz.
Varsayım 4: Rastgele örnekleme
İki örnekli t testi, her iki örneğin de rastgele örnekleme yöntemi kullanılarak elde edildiğini varsayar.
Bu hipotez nasıl doğrulanır?
Bu hipotezi test etmek için kullanabileceğimiz resmi bir istatistiksel test yoktur. Bunun yerine, her iki numunenin de rastgele örnekleme yöntemi kullanılarak elde edildiğinden emin olmamız gerekir; böylece ilgilenilen popülasyondaki her bireyin, bir veya diğer numuneye dahil olma olasılığı eşit olur.
Bu varsayıma uyulmazsa ne yapılmalı?
Bu varsayım karşılanmazsa, iki örneğimizin ilgilenilen popülasyonu temsil etmesi pek olası değildir. Bu durumda, iki örnekli t testinin sonuçlarını genel popülasyona güvenilir bir şekilde genelleştiremeyiz.
Bu senaryoda, rastgele örnekleme yöntemini kullanarak iki yeni örnek toplamak en iyisidir.