Sağa çarpık histogram: örnekler ve yorumlama
Histogram, bir veri kümesindeki değerlerin dağılımını görselleştirmemize olanak tanıyan bir grafik türüdür.
Bir histogramın dağılımın sağ tarafında bir “kuyruğu” varsa sağa çarpık olduğu söylenir:
Not : Bazen sağa çarpık histograma pozitif çarpık histogram da denir.
Sağa çarpık bir histogram aşağıdaki iki özelliğe sahiptir:
1. Dağıtımın üst kısmı sol taraftadır.
2. Ortalama medyandan büyüktür.
Histogramı düzgün şekilde çarpık yapan şey nedir?
Bir histogram genellikle mümkün olan minimum değerde bir limit olduğunda ancak mümkün olan maksimum değerde limit olmadığında sağa çarpıktır.
Sağa çarpık bir histogramın gerçek dünyadaki en belirgin örneği, bir ülkedeki gelir dağılımı olacaktır.
Bir kişinin kazanabileceği minimum gelir sıfır dolardır, kazanabileceği maksimum gelir ise yoktur.
Genel olarak çoğu kişi yılda yaklaşık 40.000 dolar kazanabilir, ancak yılda birkaç milyon dolar kazanan birkaç istisna da vardır.
Gelir dağılımını görselleştirmek için bir histogram oluşturduğumuzda doğal olarak çarpık olacaktır:
Sağa çarpık bir histogramda ortalama neden medyandan daha büyük?
Sağa çarpık bir histogramda ortalama, medyandan daha büyüktür çünkü dağılımın sağ “kuyruğundaki” yüksek değerler, ortalamanın değerini büyük ölçüde şişirecektir.
Basit bir örnek olarak, 10 kişinin gelirini içeren aşağıdaki veri setine sahip olduğumuzu varsayalım:
Veri Kümesi 1: 30.000 ABD Doları, 35.000 ABD Doları, 35.000 ABD Doları, 40.000 ABD Doları, 50.000 ABD Doları, 55.000 ABD Doları, 55.000 ABD Doları, 70.000 ABD Doları, 90.000 ABD Doları, 110.000 ABD Doları
Bu veri setine ait ortalama ve medyan değerler şöyle:
- Ortalama : 57 bin dolar
- Medyan : 52,5 bin dolar
Şimdi, son değerin şu anda 2,5 milyon dolar olması dışında, tamamen aynı geliri içeren başka bir veri setimiz olduğunu varsayalım:
Veri Kümesi 2: 30.000 ABD Doları, 35.000 ABD Doları, 35.000 ABD Doları, 40.000 ABD Doları, 50.000 ABD Doları, 55.000 ABD Doları, 55.000 ABD Doları, 70.000 ABD Doları, 90.000 ABD Doları, 2,5 milyon ABD Doları
Bu veri setine ait ortalama ve medyan değerler şöyle:
- Ortalama : 296 bin dolar
- Medyan : 52,5 bin dolar
Bu ikinci aykırı değer ortalama gelirde önemli bir artışa yol açmaktadır.
Ve eğer bu dağılımın grafiğini çizersek, histogramın sağ “kuyruğunda” yer alan 2,5 milyon dolar değerindeki sağa çarpık bir histogram olur.
Sağa ve sola çarpık histogramlar arasındaki fark
Sağa çarpık histogramın tersi sola çarpık histogramdır .
Bu, dağılımın sol tarafında “kuyruğu” bulunan bir histogram türüdür:
Bu tip histogram aşağıdaki özelliklere sahiptir:
1. Dağılımın zirvesi sağ taraftadır.
2. Ortalama medyandan düşüktür.
Bunların sağa çarpık bir histogramın tam tersi özellikleri olduğuna dikkat edin.
Bu eğitimde sola çarpık histogramlar hakkında daha fazla bilgi edinin.
Ek kaynaklar
Aşağıdaki eğitimler histogramlar hakkında ek bilgi sağlar:
Herhangi bir histogramın ortalaması ve medyanı nasıl tahmin edilir?
Herhangi bir histogramın standart sapması nasıl tahmin edilir?
Histogramların şekli nasıl tanımlanır?