İki modlu dağılım nedir?
Bimodal dağılım, iki modlu bir olasılık dağılımıdır.
Tanımlayıcı istatistiklerde genellikle “mod” terimini bir veri kümesindeki en yaygın değere atıfta bulunmak için kullanırız, ancak bu durumda “mod” terimi bir grafikteki yerel maksimuma atıfta bulunur.
İki modlu bir dağılımı görüntülerken, bu iki modu temsil eden iki farklı “zirve” fark edeceksiniz.
Bu, yalnızca bir tepe noktası olan tek modlu dağılımdan farklıdır:
Aşağıdakileri hatırlayarak ikisi arasındaki farkı hatırlayabilirsiniz:
- “bi” = iki
- “birleşik” = bir
Çoğu istatistiksel ders, farklı konuları açıklamak için normal dağılım gibi tek modlu dağılımları kullansa da, iki modlu dağılımlar pratikte oldukça sık görülür, bu nedenle bunların nasıl tanınacağını ve yorumlanacağını bilmek faydalıdır.
Not: İki modlu dağılım, çok modlu dağıtımın özel bir türüdür.
İki modlu dağılım örnekleri
İki modlu dağılımlara bazı örnekler:
Örnek 1: Restoranın Yoğun Saatleri
Belirli bir restorandaki müşterilerin saatlik dağılımını görselleştirmek için bir grafik oluşturduysanız, muhtemelen bunun öğle yemeği saatlerinde zirve ve akşam yemeği saatlerinde başka bir zirve ile iki modlu bir dağılım izlediğini göreceksiniz:
Örnek no. 2: İki bitki türünün ortalama yüksekliği
Bir tarlada dolaştığınızı ve farklı bitkilerin yüksekliğini ölçtüğünüzü varsayalım. Farkında olmadan iki farklı türün boyutunu ölçüyorsunuz: Biri oldukça büyük, diğeri oldukça küçük. Yükseklik dağılımını görselleştirmek için bir grafik oluşturduysanız, bu iki modlu bir dağılım izleyecektir:
Örnek #3: sınav sonuçları
Bir öğretmenin öğrencilerine bir sınav verdiğini varsayalım. Bazı öğrenciler sınava çalıştı, bazıları ise çalışmadı. Öğretmen sınav sonuçlarının grafiğini oluşturduğunda, iki modlu bir dağılım izler; bu dağılım, çalışmayan öğrenciler için düşük puanlar civarında bir tepe noktası ve eğitim gören öğrenciler için yüksek puanlar çevresinde başka bir tepe noktasına sahiptir:
Bimodal dağılımlara ne sebep olur?
Genellikle iki modlu dağılımlara neden olan iki şey vardır:
1. Temelde yatan bazı olgular.
Bimodal dağılımlar sıklıkla altta yatan belirli olaylardan dolayı ortaya çıkar.
Örneğin, insanlar restoranlarda iki farklı saatte yemek yemeyi tercih ettiğinden, her saat başı bir restoranı ziyaret eden müşterilerin sayısı iki modlu bir dağılım izlemektedir: öğle ve akşam yemeği. Bu temel insan davranışı çift modlu dağılımın kökenidir.
2. İki farklı grubun bir araya gelmesi.
İki modlu dağılımlar, farkında olmadan iki farklı grup şeyi basitçe analiz ettiğinizde de ortaya çıkabilir.
Örneğin, aynı tarlada iki farklı türün yetiştiğini fark etmeden belli bir tarladaki bitkilerin boylarını ölçerseniz, grafik oluşturduğunuzda bimodal bir dağılım görürsünüz.
Bimodal dağılımlar nasıl analiz edilir
Dağılımları genellikle ortalamayı veya medyanı kullanarak tanımlarız çünkü bu bize dağılımın “merkezinin” nerede olduğuna dair bir fikir verir.
Ne yazık ki, iki modlu bir dağılım için ortalama ve medyanın bilinmesi yararlı değildir. Örneğin yukarıdaki örnekte öğrencilerin ortalama sınav puanı 81’dir:
Ancak çok az sayıda öğrenci 81’e yakın puan aldı. Bu durumda ortalama yanıltıcıdır. Çoğu öğrenci aslında 74 veya 88 civarında puan aldı.
İki modlu dağılımları analiz etmenin ve yorumlamanın daha iyi bir yolu, verileri basitçe iki farklı gruba bölüp ardından her grup için merkezi ve dağılımı analiz etmektir.
Örneğin sınav sonuçlarını “düşük puanlar” ve “yüksek puanlar” olarak ayırıp her grup için ortalamayı ve standart sapmayı bulabiliriz.
Bir analizin sonuçlarını paylaşıyorsanız ve verileriniz iki modlu bir dağılım izliyorsa, yukarıda gösterilenlere benzer bir histogram oluşturmak yararlı olacaktır; böylece hedef kitleniz, dağılımın iki farklı “zirveye” sahip olduğunu ve yalnızca Büyük bir veri seti yerine her bir zirveyi ayrı ayrı analiz etmek mantıklıdır.