Çok modlu dağıtım nedir?


Multimodal dağılım, iki veya daha fazla modu olan bir olasılık dağılımıdır.

Çok modlu bir dağılımı görselleştirmek için bir histogram oluşturursanız, bunun birkaç tepe noktasına sahip olduğunu fark edeceksiniz:

Çok modlu dağıtım

Bir dağılım tam olarak iki zirveye sahipse, bu, çok modlu dağılımın özel bir türü olan iki modlu bir dağılım olarak kabul edilir.

Bu, yalnızca bir tepe noktası olan tek modlu bir dağılımla çelişir:

Normal dağılım gibi tek modlu dağılımlar çoğunlukla istatistik konularını açıklamak için kullanılsa da, çok modlu dağılımlar aslında pratikte oldukça sık görülür, bu nedenle bunların nasıl tanınacağını ve analiz edileceğini bilmek faydalıdır.

Çok modlu dağılım örnekleri

Çok modlu dağılımlara bazı örnekler aşağıda verilmiştir.

Örnek 1: Sınav sonuçlarının dağıtımı

Bir profesörün sınıfına sınav yaptığını varsayalım. Bazı öğrenciler okudu, bazıları okumadı. Profesör sınav puanlarına ilişkin bir histogram oluşturduğunda, bu, çalışmayan öğrenciler için düşük puanlar civarında bir tepe noktası ve eğitim gören öğrenciler için yüksek puanlar çevresinde başka bir tepe noktası olan çok modlu bir dağılım izler:

Çok modlu dağıtım örneği

Örnek 2: Farklı bitki türlerinin yüksekliği

Bir bilim adamının bir tarlada dolaştığını ve farklı bitkilerin yüksekliğini ölçtüğünü varsayalım. Farkında olmadan üç farklı türün boyutunu ölçüyor: biri oldukça büyük, diğeri orta büyüklükte ve diğeri oldukça küçük.

Yükseklik dağılımını görselleştirmek için bir histogram oluşturduğunda bunun çok modlu olduğunu buluyor: her bir tepe noktası, üç farklı türün en yaygın yüksekliğini temsil ediyor.

Çok modlu dağıtım örneği

Örnek 3: Müşterilerin dağılımı

Bir restoran sahibi, saat başı restorana gelen müşteri sayısını takip ediyor. Müşterilerin dağılımını görselleştirmek için bir histogram oluşturduğunda dağıtımın çok modlu olduğunu görüyor: öğle yemeği saatlerinde bir zirve, akşam yemeği saatlerinde ise başka bir zirve var.

Multimodal dağılımların nedenleri nelerdir?

Multimodal dağılımların altında genellikle iki nedenden biri vardır:

1. Birkaç grup bir arada gruplandırılmıştır.

Farkında olmadan birden fazla grup için veri topladığınızda çok modlu dağılımlar ortaya çıkabilir.

Örneğin, bir bilim adamı bilmeden aynı alanda bulunan üç farklı bitki türünün yüksekliğini ölçerse, aynı histograma yerleştirildiğinde tüm bitkilerin dağılımı çok modlu görünecektir.

2. Altta yatan bir olgu var.

Multimodal dağılımlar, altta yatan belirli olaylar nedeniyle de ortaya çıkabilir.

Örneğin, insanlar restoranlarda iki farklı saatte yemek yemeyi tercih ettiğinden, her saat başı bir restoranı ziyaret eden müşterilerin sayısı çok modlu bir dağılım izlemektedir: öğle ve akşam yemeği. Bu temel insan davranışı çok modlu dağıtımın kökenidir.

Çok modlu dağılımlar nasıl analiz edilir

Dağılımları genellikle ortalamayı veya medyanı kullanarak tanımlarız çünkü bu bize dağılımın “merkezinin” nerede olduğuna dair bir fikir verir.

Ne yazık ki, iki modlu bir dağılım için ortalama ve medyanın bilinmesi yararlı değildir. Örneğin yukarıdaki örnekte öğrencilerin ortalama sınav puanı 81’dir:

Ancak çok az sayıda öğrenci 81’e yakın puan aldı. Bu durumda ortalama yanıltıcıdır. Çoğu öğrenci aslında 74 veya 88 civarında puan aldı.

İki modlu dağılımları analiz etmenin ve yorumlamanın daha iyi bir yolu, verileri basitçe iki ayrı gruba bölmek ve ardından her grup için merkezi konumu ve dağılımı ayrı ayrı analiz etmektir.

Örneğin sınav sonuçlarını “düşük puanlar” ve “yüksek puanlar” olarak ayırıp her grup için ortalamayı ve standart sapmayı bulabiliriz.

Ortalama, medyan veya standart sapma gibi belirli bir dağılım için özet istatistikleri hesaplarken, tek modlu mu yoksa çok modlu mu olduğunu belirlemek için dağılımı görselleştirdiğinizden emin olun.

Bir dağılım multimodal ise, onu tek bir ortalama, medyan veya standart sapma kullanarak tanımlamak yanıltıcı olabilir.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir