Ki-kare testi
Bu makalede istatistikte ki-kare testinin ne olduğu ve ne için kullanıldığı anlatılmaktadır. Ayrıca ki-kare testinin nasıl yapılacağını ve buna ek olarak adım adım çözülmüş bir alıştırmayı da keşfedeceksiniz.
Ki kare testi nedir?
Ki-kare testi, beklenen frekans ile gözlenen frekans arasında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için kullanılan istatistiksel bir testtir.
Mantıksal olarak ki-kare test istatistiği ki-kare dağılımını takip eder. Bu nedenle test istatistiğinin değeri, ki-kare dağılımının belirli bir değeriyle karşılaştırılmalıdır. Aşağıda ki kare testinin nasıl yapıldığını göreceğiz.
Bu tür istatistiksel test aynı zamanda Pearson ki-kare testi olarak da bilinir ve bazen ki-kare dağılımının sembolü ile temsil edilir: χ² testi .
Ki-kare testi formülü
Ki-kare test istatistiği, gözlenen değerler ile beklenen değerler arasındaki farkların karelerinin toplamının beklenen değerlere bölünmesine eşittir.
Yani ki-kare testinin formülü şu şekildedir:
Altın:
-
ki-kare dağılımını takip eden ki-kare test istatistiğidir
özgürlük derecesi.
-
veri örneği boyutudur.
-
i verileri için gözlemlenen değerdir.
-
i verisi için beklenen değerdir.
Ki-kare testini test eden hipotezin sıfır hipotezi, gözlenen değerlerin beklenen değerlere eşdeğer olmasıdır. Öte yandan testin alternatif hipotezi, gözlenen değerlerden birinin beklenen değerden farklı olmasıdır.
Yani, bir önem düzeyi göz önüne alındığında
hesaplanan test istatistiği, boş hipotezin mi yoksa alternatif hipotezin mi reddedileceğini belirlemek için kritik test değeriyle karşılaştırılmalıdır:
- Test istatistiği kritik değerden küçükse
alternatif hipotez reddedilir (ve sıfır hipotezi kabul edilir).
- Test istatistiği kritik değerden büyükse
sıfır hipotezi reddedilir (ve alternatif hipotez kabul edilir).
Ki kare testi örneği
Ki kare testinin tanımını ve formülünü gördükten sonra, bu tür istatistiksel testlerin nasıl yapıldığını görebilmeniz için aşağıda adım adım çözümlü bir örnek sunulmaktadır.
- Bir mağaza sahibi, satışlarının %50’sinin A ürünü, %35’inin B ürünü ve %15’inin C ürünü olduğunu söylüyor. Ancak her ürünün satılan adetleri, sunulduğu adetlerdir. aşağıdaki acil durum tablosunda . Sahibinin teorik verilerinin toplanan gerçek verilerden istatistiksel olarak farklı olup olmadığını analiz edin.
Ürün | Gözlemlenen satışlar (O i ) |
---|---|
Ürün A | 453 |
Ürün B | 268 |
Ürün C | 79 |
Toplam | 800 |
Öncelikle mağaza sahibinin beklediği değerleri hesaplamamız gerekiyor. Bunu yapmak için her bir ürünün beklenen satış yüzdesini, elde edilen toplam satış sayısıyla çarpıyoruz:
Dolayısıyla problemin frekans dağılım tablosu şu şekildedir:
Ürün | Gözlemlenen satışlar (O i ) | Beklenen satışlar (E i ) |
---|---|---|
Ürün A | 453 | 400 |
Ürün B | 268 | 280 |
Ürün C | 79 | 120 |
Toplam | 800 | 800 |
Artık tüm değerleri hesapladığımıza göre test istatistiğini hesaplamak için ki-kare test formülünü uyguluyoruz:
Test istatistiğinin değeri hesaplandıktan sonra testin kritik değerini bulmak için ki-kare dağılım tablosunu kullanırız. Ki-kare dağılımı
serbestlik derecesi, dolayısıyla bir önem düzeyi seçersek
Testin kritik değeri aşağıdaki gibidir:
Dolayısıyla test istatistiği (21,53) kritik test değerinden (5,991) büyük olduğundan sıfır hipotezi reddedilir ve alternatif hipotez kabul edilir. Bu, verilerin çok farklı olduğu ve dolayısıyla mağaza sahibinin gerçekte gerçekleşenden farklı satışlar beklediği anlamına gelir.
Ki kare testinin yorumlanması
Ki kare testinin yorumlanması yalnızca elde edilen test sonucuyla yapılamaz, testin kritik değeriyle karşılaştırılması gerekir.
Mantıksal olarak, hesaplanan test istatistiğinin değeri ne kadar küçükse, gözlemlenen veriler beklenen verilere o kadar benzerdir. Yani ki-kare testi sonucu 0 ise gözlenen değerler ile beklenen değerlerin tamamen aynı olduğu anlamına gelir. Öte yandan test sonucu ne kadar büyük olursa, bu da gözlenen değerlerin beklenen değerlerden o kadar farklı olduğu anlamına gelir.
Bununla birlikte, iki veri setinin istatistiksel olarak farklı veya eşit olup olmadığına karar vermek için, sıfır hipotezini veya karşıtlığın alternatif hipotezini reddetmek amacıyla hesaplanan test değeri kritik test değeriyle karşılaştırılmalıdır. Test istatistiği dağılımın kritik değerinden küçükse alternatif hipotez reddedilir. Öte yandan test istatistiği dağılımın kritik değerinden büyükse sıfır hipotezi reddedilir.