Sağa çarpık histogram: örnekler ve yorumlama


Histogram, bir veri kümesindeki değerlerin dağılımını görselleştirmemize olanak tanıyan bir grafik türüdür.

Bir histogramın dağılımın sağ tarafında bir “kuyruğu” varsa sağa çarpık olduğu söylenir:

sağa çarpık histogram

Not : Bazen sağa çarpık histograma pozitif çarpık histogram da denir.

Sağa çarpık bir histogram aşağıdaki iki özelliğe sahiptir:

1. Dağıtımın üst kısmı sol taraftadır.

sağa çarpık histogramın zirvesi

2. Ortalama medyandan büyüktür.

sağa çarpık histogramda ortalama ve medyan

Histogramı düzgün şekilde çarpık yapan şey nedir?

Bir histogram genellikle mümkün olan minimum değerde bir limit olduğunda ancak mümkün olan maksimum değerde limit olmadığında sağa çarpıktır.

Sağa çarpık bir histogramın gerçek dünyadaki en belirgin örneği, bir ülkedeki gelir dağılımı olacaktır.

Bir kişinin kazanabileceği minimum gelir sıfır dolardır, kazanabileceği maksimum gelir ise yoktur.

Genel olarak çoğu kişi yılda yaklaşık 40.000 dolar kazanabilir, ancak yılda birkaç milyon dolar kazanan birkaç istisna da vardır.

Gelir dağılımını görselleştirmek için bir histogram oluşturduğumuzda doğal olarak çarpık olacaktır:

sağa çarpık histogramın gerçek hayattan örneği

Sağa çarpık bir histogramda ortalama neden medyandan daha büyük?

Sağa çarpık bir histogramda ortalama, medyandan daha büyüktür çünkü dağılımın sağ “kuyruğundaki” yüksek değerler, ortalamanın değerini büyük ölçüde şişirecektir.

Basit bir örnek olarak, 10 kişinin gelirini içeren aşağıdaki veri setine sahip olduğumuzu varsayalım:

Veri Kümesi 1: 30.000 ABD Doları, 35.000 ABD Doları, 35.000 ABD Doları, 40.000 ABD Doları, 50.000 ABD Doları, 55.000 ABD Doları, 55.000 ABD Doları, 70.000 ABD Doları, 90.000 ABD Doları, 110.000 ABD Doları

Bu veri setine ait ortalama ve medyan değerler şöyle:

  • Ortalama : 57 bin dolar
  • Medyan : 52,5 bin dolar

Şimdi, son değerin şu anda 2,5 milyon dolar olması dışında, tamamen aynı geliri içeren başka bir veri setimiz olduğunu varsayalım:

Veri Kümesi 2: 30.000 ABD Doları, 35.000 ABD Doları, 35.000 ABD Doları, 40.000 ABD Doları, 50.000 ABD Doları, 55.000 ABD Doları, 55.000 ABD Doları, 70.000 ABD Doları, 90.000 ABD Doları, 2,5 milyon ABD Doları

Bu veri setine ait ortalama ve medyan değerler şöyle:

  • Ortalama : 296 bin dolar
  • Medyan : 52,5 bin dolar

Bu ikinci aykırı değer ortalama gelirde önemli bir artışa yol açmaktadır.

Ve eğer bu dağılımın grafiğini çizersek, histogramın sağ “kuyruğunda” yer alan 2,5 milyon dolar değerindeki sağa çarpık bir histogram olur.

Sağa ve sola çarpık histogramlar arasındaki fark

Sağa çarpık histogramın tersi sola çarpık histogramdır .

Bu, dağılımın sol tarafında “kuyruğu” bulunan bir histogram türüdür:

Bu tip histogram aşağıdaki özelliklere sahiptir:

1. Dağılımın zirvesi sağ taraftadır.

2. Ortalama medyandan düşüktür.

Bunların sağa çarpık bir histogramın tam tersi özellikleri olduğuna dikkat edin.

Bu eğitimde sola çarpık histogramlar hakkında daha fazla bilgi edinin.

Ek kaynaklar

Aşağıdaki eğitimler histogramlar hakkında ek bilgi sağlar:

Herhangi bir histogramın ortalaması ve medyanı nasıl tahmin edilir?
Herhangi bir histogramın standart sapması nasıl tahmin edilir?
Histogramların şekli nasıl tanımlanır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir