Stata'da normallik nasıl test edilir
Birçok istatistiksel test, test sonuçlarının güvenilir olması için bir veya daha fazla değişkenin normal şekilde dağılmasını gerektirir.
Bu eğitimde Stata’daki değişkenler arasındaki normalliği test etmek için kullanabileceğiniz çeşitli yöntemler açıklanmaktadır.
Bu yöntemlerin her biri için auto adı verilen yerleşik Stata veri kümesini kullanacağız. Bu veri kümesini aşağıdaki komutu kullanarak yükleyebilirsiniz:
sistemin otomatik kullanımı
Yöntem 1: histogramlar
Bir değişkenin normal şekilde dağılıp dağılmadığını görmenin resmi olmayan bir yolu, değişkenin dağılımını gösterecek bir histogram oluşturmaktır.
Değişken normal şekilde dağılmışsa , histogram, merkeze yakın yerlerde daha fazla değer ve kuyruklarda daha az değer bulunan bir “çan” şeklini almalıdır.
Değişken yer değiştirme için bir histogram oluşturmak amacıyla hist komutunu kullanabiliriz:
hareketli tarih
Normal komutunu kullanarak histograma normal yoğunluk eğrisi ekleyebiliriz:
geçmişin taşınması, normal
Değişken kaymasının sağa çarpık olduğu (örneğin, çoğu değer solda yoğunlaşmıştır ve değerlerin uzun bir “kuyruğu” sağa doğru uzanır) ve normal bir dağılım izlemediği oldukça açıktır.
İlgili: Sola ve Sağa Çarpık Dağılımlar
Yöntem 2: Shapiro-Wilk testi
Normalliği test etmenin resmi bir yolu Shapiro-Wilk testini kullanmaktır.
Bu testin sıfır hipotezi değişkenin normal dağıldığıdır. Testin p değeri belirli bir anlamlılık düzeyinin altındaysa (ortak seçenekler 0,01, 0,05 ve 0,10’u içerir), o zaman sıfır hipotezini reddedebilir ve değişkenin normal dağılmadığını iddia etmek için yeterli kanıt olduğu sonucuna varabiliriz. .
*Bu test toplam gözlem sayısı 4 ila 2.000 arasında olduğunda kullanılabilir.
Değişken yer değiştirme üzerinde Shapiro-Wilk testi gerçekleştirmek için swilk komutunu kullanabiliriz:
düzgün hareket
Test sonucunu nasıl yorumlayacağınız aşağıda açıklanmıştır:
Obs: 74. Bu, testte kullanılan gözlem sayısıdır.
W: 0,92542. Bu, testin test istatistiğidir.
Olasılık>z: 0,00031. Bu, test istatistiğiyle ilişkili p değeridir.
P değeri 0,05’ten küçük olduğundan testin sıfır hipotezini reddedebiliriz. Değişken yer değiştirmenin normal dağılmadığını söyleyecek yeterli kanıtımız var.
Ayrıca swilk komutundan sonra birden fazla değişkeni listeleyerek Shapiro-Wilk testini birden fazla değişken üzerinde aynı anda gerçekleştirebiliriz:
hızlı yer değiştirme mpg uzunluğu
0,05 anlamlılık düzeyini kullanarak yer değiştirme ve mpg’nin normal dağılmadığı sonucuna varabiliriz, ancak uzunluğun normal dağılmadığını söyleyecek yeterli kanıtımız yok.
Yöntem 3: Shapiro-Francia testi
Normalliği test etmenin bir başka resmi yolu da Shapiro-Francia testini kullanmaktır.
Bu testin sıfır hipotezi değişkenin normal dağıldığıdır. Testin p değeri belirli bir anlamlılık düzeyinin altındaysa, sıfır hipotezini reddedebilir ve değişkenin normal dağılmadığını söylemek için yeterli kanıtın olduğu sonucuna varabiliriz.
*Bu test toplam gözlem sayısının 10 ila 5.000 arasında olduğu durumlarda kullanılabilir.
Değişken yer değiştirme üzerinde Shapiro-Wilk Testi gerçekleştirmek için sfrancia komutunu kullanabiliriz:
Sfrancia’yı hareket ettirmek
Test sonucunu nasıl yorumlayacağınız aşağıda açıklanmıştır:
Obs: 74. Bu, testte kullanılan gözlem sayısıdır.
W’: 0,93011. Bu, testin test istatistiğidir.
Olasılık>z: 0,00094. Bu, test istatistiğiyle ilişkili p değeridir.
P değeri 0,05’ten küçük olduğundan testin sıfır hipotezini reddedebiliriz. Değişken yer değiştirmenin normal dağılmadığını söyleyecek yeterli kanıtımız var.
Shapiro-Wilk testine benzer şekilde, sfrancia komutundan sonra birden fazla değişkeni listeleyerek Shapiro-Francia testini aynı anda birden fazla değişken üzerinde gerçekleştirebilirsiniz.
Yöntem 4: çarpıklık ve basıklık testi
Normalliği test etmenin bir başka yolu, bir değişkenin çarpıklık ve basıklığının normal dağılımla tutarlı olup olmadığını belirleyen çarpıklık ve basıklık testini kullanmaktır.
Bu testin sıfır hipotezi değişkenin normal dağıldığıdır. Testin p değeri belirli bir anlamlılık düzeyinin altındaysa, sıfır hipotezini reddedebilir ve değişkenin normal dağılmadığını söylemek için yeterli kanıtın olduğu sonucuna varabiliriz.
*Bu testin kullanılması en az 8 gözlem gerektirir.
Değişken yer değiştirme üzerinde çarpıklık ve basıklık testi gerçekleştirmek için sktest komutunu kullanabiliriz:
testi hareket ettirmek
Test sonucunu nasıl yorumlayacağınız aşağıda açıklanmıştır:
Obs: 74. Bu, testte kullanılan gözlem sayısıdır.
adj chi(2): 5.81. Bu, testin ki-kare test istatistiğidir.
Olasılık>chi2: 0,0547. Bu, test istatistiğiyle ilişkili p değeridir.
P değeri 0,05’ten küçük olmadığı için testin sıfır hipotezini reddedemiyoruz. Hareketlerin normal dağılmadığını söyleyecek yeterli kanıtımız yok.
Diğer normallik testlerine benzer şekilde sktest komutundan sonra birden fazla değişkeni listeleyerek birden fazla değişken üzerinde çarpıklık ve basıklık testini aynı anda gerçekleştirebilirsiniz.