Asimetri (istatistik)
Bu makale istatistikte çarpıklığın ne anlama geldiğini açıklamaktadır. Böylece istatistikte asimetrinin tanımını, farklı asimetri türlerinin neler olduğunu, asimetri katsayısının nasıl hesaplandığını ve nasıl yorumlandığını bulacaksınız.
İstatistikte asimetri nedir?
İstatistiklerde çarpıklık , bir dağılımın ortalamasına göre simetri (veya asimetri) derecesini gösteren bir ölçüdür. Basitçe söylemek gerekirse çarpıklık, bir dağılımın simetri (veya asimetri) derecesini grafiksel olarak göstermeye gerek kalmadan belirlemek için kullanılan istatistiksel bir parametredir.
Dolayısıyla çarpık bir dağılım, ortalamanın solunda sağdakilerden farklı sayıda değere sahip olan dağılımdır. Öte yandan simetrik bir dağılımda ortalamanın solunda ve sağında aynı sayıda değer bulunur.
Örneğin üstel dağılım asimetrik, normal dağılım ise simetriktir.
Asimetri türleri
İstatistikte üç tür asimetri vardır:
- Pozitif asimetri : Dağılımın ortalamanın sağında soluna göre daha farklı değerleri vardır.
- Simetri : Dağılım, ortalamanın solunda ve ortalamanın sağında aynı sayıda değere sahiptir.
- Negatif çarpıklık : Dağılımın ortalamanın solunda sağına göre daha farklı değerleri vardır.
Asimetri katsayısı
Çarpıklık katsayısı veya asimetri indeksi , bir dağılımın asimetrisini belirlemeye yardımcı olan istatistiksel bir katsayıdır. Yani asimetri katsayısını hesaplayarak, dağılımın asimetri türünü, bunun grafiksel bir gösterimini yapmaya gerek kalmadan öğrenebilirsiniz.
Asimetri katsayısını hesaplamak için farklı formüller olsa da ve aşağıda hepsini göreceğiz, kullanılan formül ne olursa olsun asimetri katsayısının yorumlanması her zaman şu şekilde yapılır:
- Çarpıklık katsayısı pozitif ise dağılım pozitif çarpıktır .
- Çarpıklık katsayısı sıfır ise dağılım simetriktir .
- Çarpıklık katsayısı negatif ise dağılım negatif çarpıktır .
Fisher’in asimetri katsayısı
Fisher’in çarpıklık katsayısı, ortalamaya göre üçüncü momentin numune standart sapmasına bölünmesine eşittir. Bu nedenle Fisher’in asimetri katsayısının formülü şöyledir:
Eşdeğer olarak, Fisher katsayısını hesaplamak için aşağıdaki iki formülden herhangi biri kullanılabilir:
Altın
matematiksel bir umuttur,
aritmetik ortalama,
standart sapma ve
toplam veri sayısı.
Öte yandan veriler gruplandırılmışsa aşağıdaki formülü kullanabilirsiniz:
Bu durumda nerede
Bu sınıf işaretidir ve
kursun mutlak sıklığı.
Pearson’un asimetri katsayısı
Pearson çarpıklık katsayısı, örnek ortalama ile mod arasındaki farkın standart sapmaya (veya standart sapmaya) bölünmesine eşittir. Pearson asimetri katsayısının formülü bu nedenle aşağıdaki gibidir:
Altın
Pearson katsayısıdır,
aritmetik ortalama,
moda ve
Standart sapma.
Pearson çarpıklık katsayısının yalnızca tek modlu bir dağılım olması, yani verilerde yalnızca bir mod olması durumunda hesaplanabileceğini unutmayın.
Bazı yazarlar Pearson çarpıklık katsayısını hesaplamak için mod yerine medyanı kullanır ancak genel olarak yukarıdaki formül kullanılır.
Bowley’in asimetri katsayısı
Bowley’in çarpıklık katsayısı, üçüncü çeyrek artı birinci çeyrek eksi medyanın iki katının toplamının üçüncü ve birinci çeyrekler arasındaki farka bölünmesine eşittir. Dolayısıyla bu asimetri katsayısının formülü aşağıdaki gibidir:
Altın
Ve
Bunlar sırasıyla birinci ve üçüncü çeyreklerdir ve
dağılımın medyanıdır.
Bir dağılımın medyanının ikinci çeyrekle çakıştığını hatırlayın.
İstatistikte asimetri ne için kullanılır?
İstatistikte asimetrinin anlamını tam olarak anlamak için bir dağılımın bu özelliğinin nasıl hesaplandığına bakalım.
Çarpıklık esas olarak bir olasılık dağılımının şeklini bilmek için kullanılır, çünkü çarpıklık katsayısını hesaplayarak grafik gösterimini yapmak zorunda kalmadan bunun negatif asimetrik, pozitif asimetrik veya simetrik bir dağılım olup olmadığını öğrenebilirsiniz.
Ek olarak çarpıklık ve basıklık, bir veri setinin normal dağılıma yaklaşıp yaklaşamayacağını belirlemek için kullanılır. Başka bir deyişle, çarpıklık katsayısı ve basıklık katsayısı, bir veri serisinin normal dağılım varsayımlarını karşılayıp karşılamadığını kontrol etmek için hesaplanır ve eğer öyleyse, bu çok faydalı olur çünkü birçok istatistiksel teoremin uygulanabileceğini ima eder.