Ortalama vs ne zaman kullanılır? medyan: örneklerle
Bir veri kümesinin ortalaması , veri kümesinin ortalama değerini temsil eder. Aşağıdaki şekilde hesaplanır:
Ortalama = Σx i / n
Altın:
- Σ: “toplam” anlamına gelen bir sembol
- x i : Bir veri setindeki i’inci gözlem
- n: veri kümesindeki toplam gözlem sayısı
Medyan, bir veri kümesinin orta değerini temsil eder. Bir veri setindeki tüm gözlemlerin en küçükten en büyüğe doğru sıralanması ve ardından medyan değerinin belirlenmesiyle hesaplanır.
Örneğin, 11 gözlem içeren aşağıdaki veri setine sahip olduğumuzu varsayalım:
Veri kümesi: 3, 4, 4, 6, 7, 8, 12, 13, 15, 16, 17
Veri setinin ortalaması şu şekilde hesaplanır:
Ortalama = (3+4+4+6+7+8+12+13+15+16+17) / 11 = 9,54
Veri kümesinin medyanı, tam ortadaki değerdir ve 8 olduğu ortaya çıkar:
3, 4, 4, 6, 7 , 8, 12, 13, 15, 16, 17
Bir veri kümesinin merkezinin nerede olduğuna ilişkin ortalama ve medyan tahmini. Ancak verinin niteliğine bağlı olarak ortalama veya medyan, veri setinin merkezini tanımlamada daha yararlı olabilir.
Ortalama ne zaman kullanılır?
Dağılım esasen simetrik olduğunda ve aykırı değerler olmadığında, bir veri kümesinin merkezini tanımlamak için ortalamayı kullanmak en iyisidir.
Örneğin, belirli bir şehirde yaşayanların maaşlarını gösteren aşağıdaki dağılıma sahip olduğumuzu varsayalım:
Bu dağılım oldukça simetrik olduğundan (ortadan bölerseniz her yarım kabaca eşit görünür) ve aykırı değerler olmadığından, bu veri kümesinin merkezini tanımlamak için ortalamayı kullanabiliriz.
Ortalama 63.000 dolar olarak ortaya çıkıyor ve bu da yaklaşık olarak dağılımın merkezinde yer alıyor:
Medyan ne zaman kullanılır?
Dağılım çarpık olduğunda veya aykırı değerler olduğunda medyanı kullanmak en iyisidir.
Bozuk veriler:
Bir dağılım çarpık olduğunda medyan, dağılımın merkezini ortalamadan daha iyi tanımlar.
Örneğin, belirli bir şehirde yaşayanların maaşlarının aşağıdaki dağılımını düşünün:
Medyan, bir sakinin “tipik” maaşını ortalamadan daha iyi yansıtır. Bunun nedeni, dağılımın kuyruğundaki yüksek değerlerin ortalamayı merkezden uzağa ve uzun kuyruğa doğru itme eğiliminde olmasıdır.
Bu örnekte, ortalama bize tipik bir bireyin yılda yaklaşık 47.000 ABD Doları kazandığını söylerken medyan bize tipik bir bireyin yılda yalnızca 32.000 ABD Doları civarında kazandığını söylüyor; bu da tipik bir bireyi çok daha iyi temsil ediyor.
Aykırı Değerler:
Medyan ayrıca verilerde aykırı değerler olduğunda dağılımın merkezi konumunun daha iyi yakalanmasına yardımcı olur. Örneğin, belirli bir caddedeki evlerin metrekaresini gösteren aşağıdaki grafiği düşünün:
Ortalama, birkaç aşırı büyük evden büyük ölçüde etkilenirken, medyan etkilenmemektedir. Böylece medyan, o sokaktaki bir evin “tipik” metrekaresini yakalama konusunda ortalamadan daha iyi bir iş çıkarıyor.
Özet
Özetle:
- Ortalama ve medyan, bir veri kümesinin “merkezinin” nerede olduğunu tanımlamak için kullanılabilir.
- Veri değerlerinin dağılımı simetrik olduğunda ve belirgin aykırı değerler olmadığında ortalamayı kullanmak en iyisidir.
- Veri değerlerinin dağılımı çarpık olduğunda veya belirgin aykırı değerler olduğunda medyanı kullanmak en iyisidir.
Ek kaynaklar
Aykırı değerler ortalamayı nasıl etkiler?
Herhangi bir histogramın ortalaması ve medyanı nasıl tahmin edilir?
Kök ve yaprak grafiklerinin ortalaması ve medyanı nasıl bulunur?