Histogramlar nasıl karşılaştırılır (örneklerle)
Histogram, bir veri kümesindeki değerlerin dağılımını görselleştirmemize olanak tanıyan bir grafik türüdür.
X ekseni veri kümesinin değerlerini, Y ekseni ise her değerin sıklığını gösterir.
Histogramlar faydalıdır çünkü bir veri kümesindeki değerlerin dağılımını hızlı bir şekilde anlamamıza olanak tanırlar. Ayrıca iki farklı veri kümesini karşılaştırmak için de kullanışlıdırlar.
İki veya daha fazla histogramı karşılaştırırken üç farklı soruyu yanıtlayabiliriz:
1. Medyan değerler nasıl karşılaştırılır?
Medyanın her histogramın ortasına yakın bir yerde olduğunu kabaca tahmin edebiliriz, bu da dağılımların medyan değerlerini karşılaştırmamıza olanak tanır.
2. Dağılım nasıl karşılaştırılır?
Hangi histogramın daha yayılmış olduğunu görsel olarak görebiliyoruz, bu da bize hangi dağılımın daha dağınık değerlere sahip olduğu konusunda fikir veriyor.
3. Asimetri nasıl karşılaştırılır?
Bir histogramın grafiğin sol tarafında bir “kuyruğu” varsa, bunun negatif çarpık olduğu söylenir. Tersine, eğer bir histogram grafiğin sağ tarafında bir “kuyruğa” sahipse, bunun pozitif olarak çarpık olduğu söylenir. Çarpıklığı karşılaştırmak için her histogramı görsel olarak kontrol edebiliriz.
Aşağıdaki örnek, iki farklı histogramın nasıl karşılaştırılacağını ve bu üç sorunun nasıl yanıtlanacağını gösterir.
Örnek: histogramları karşılaştırma
200 öğrencinin bir sınava hazırlanmak için bir çalışma yöntemi kullandığını ve diğer 200 öğrencinin de aynı sınava hazırlanmak için farklı bir çalışma yöntemi kullandığını varsayarız.
Her öğrenci grubunun sınav sonuçlarını karşılaştırmak için aşağıdaki histogramları oluşturduğumuzu varsayalım:
Bu histogramları karşılaştırabilir ve aşağıdaki üç soruyu yanıtlayabiliriz:
1. Medyan değerler nasıl karşılaştırılır?
Basitçe histogramlara bakarak her dağılımın tam ortanca değerini bilemesek de, Yöntem 1’i kullanan öğrencilerin ortanca sınav puanının, Yöntem 1’i kullanan öğrencilerin ortanca sınav puanından daha yüksek olduğu açıktır. yöntem 2.
Yöntem 1’in medyan değerinin 84 civarında, yöntem 2’nin medyan değerinin ise 78 civarında olduğunu tahmin edebiliriz.
2. Dağılım nasıl karşılaştırılır?
Yöntem 2’ye ait histogram değerleri, Yöntem 1’e göre çok daha dağınıktır; bu da bize, Yöntem 2’yi kullanan öğrencilerin sınav sonuçlarında çok daha büyük bir dağılım olduğunu gösterir.
3. Asimetri nasıl karşılaştırılır?
Histogramlara bakıldığında, Yöntem 1 için test puanlarının dağılımının, histogramın sağına doğru uzanan “kuyruk” ile gösterildiği gibi, hafifçe sağa çarpık olduğu görülmektedir.
Ancak 2. yönteme ilişkin sınav sonuçlarının dağılımında bir “kuyruk” görünmüyor, bu da bize dağılımın çok az veya çarpık olmadığını gösteriyor.
Bonus : İşte bu iki histogramı oluşturmak için R’de kullandığımız kod:
library (ggplot2)
#make this example reproducible
set. seeds (0)
#create data frame
df <- data. frame (method=rep(c(' Method 1 ', ' Method 2 '), each= 200 ),
Score=c(rnorm( 200 , mean= 84 , sd= 2 ),
rnorm( 200 , mean= 78 , sd= 4 )))
#create histogram of scores for each method
ggplot(df, aes(x=Score)) +
geom_histogram(fill=' steelblue ', color=' black ') +
facet_wrap(.~method, nrow= 2 ) +
labs(title=' Exam Scores by Study Method ')
Ek kaynaklar
Aşağıdaki eğitimlerde histogramlarla diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
Herhangi bir histogramın ortalaması ve medyanı nasıl tahmin edilir?
Herhangi bir histogramın standart sapması nasıl tahmin edilir?
Histogramların şekli nasıl tanımlanır?