İstatistikte koşullu dağılım nedir?


X ve Y ortaklaşa dağıtılan iki rastgele değişkense , o zaman X’in verildiği Y’nin koşullu dağılımı, X’in belirli bir değer olduğu bilindiğinde Y’nin olasılık dağılımıdır.

Örneğin, aşağıdaki iki yönlü tablo 100 kişiye hangi sporu tercih ettiklerini soran bir anketin sonuçlarını göstermektedir: beyzbol, basketbol veya futbol.

Bir kişinin erkek olduğu göz önüne alındığında belirli bir sporu tercih etme olasılığını bilmek istiyorsak, bu bir koşullu dağılım örneğidir.

Bir rastgele değişkenin değeri biliniyor (kişi bir erkek), ancak diğer rastgele değişkenin değeri bilinmiyor (en sevdiği sporu bilmiyoruz).

Erkekler arasındaki spor tercihlerinin koşullu dağılımını bulmak için tablodaki erkeklere yönelik çizginin değerlerine bakmamız yeterlidir:

Koşullu Dağıtım Örneği

Koşullu dağılım şu şekilde hesaplanacaktır:

  • Beyzbolu tercih eden erkekler: 13/48 = 0,2708
  • Basketbolu tercih eden erkekler: 15/48 = 0,3125
  • Futbolu tercih eden erkekler: 20/48 = 0,4167

Olasılıkların toplamının 1 olduğuna dikkat edin: 13/48 + 15/48 + 20/48 = 48/48 = 1.

Bu koşullu dağılımı şu tür soruları yanıtlamak için kullanabiliriz: Bir bireyin erkek olduğu göz önüne alındığında, beyzbolun onun en sevdiği spor olma olasılığı nedir?

Daha önce hesapladığımız koşullu dağılımdan olasılığın 0,2708 olduğunu görebiliriz.

Teknik açıdan, koşullu bir dağılım hesapladığımızda, genel nüfusun belirli bir alt popülasyonuyla ilgilendiğimizi söyleriz. Önceki örnekteki alt popülasyon erkeklerden oluşuyordu:

Koşullu bir dağılım için alt popülasyon

Ve bu alt popülasyona bağlı bir olasılığı hesaplamak istediğimizde, belirli bir ilgi çekici karakterle ilgilendiğimizi söyleriz. Önceki örnekteki ilginç karakter beyzboldu:

İstatistiklerde koşullu dağılım

İlgilenilen özelliğin alt popülasyonda ortaya çıkma olasılığını bulmak için, ilgilenilen özelliğin değerini (örn. 13) alt popülasyonun toplam değerlerine (örn. 48) bölerek 13/48 = 0,2708 elde ederiz.

Koşullu dağılımlar ve bağımsızlık

Rastgele değişkenler X ve Y’nin bağımsız olduğunu ancak ve ancak X’in verildiği Y’nin koşullu dağılımının, X’in tüm olası gerçekleşmeleri için Y’nin koşulsuz dağılımına eşit olması durumunda söyleyebiliriz.

Örneğin bir önceki tabloda “beyzbolu tercih ediyor” ve “erkek” testlerinin bağımsız olduğunu görebiliyor muyuz?

Bu soruyu cevaplamak için aşağıdaki olasılıkları hesaplayalım:

  • P(beyzbolu tercih eder)
  • P(beyzbolu tercih ediyor | erkek) “erkek oldukları göz önüne alındığında beyzbolu tercih ediyor

Belirli bir bireyin beyzbolu tercih etme olasılığı:

  • P (beyzbolu tercih ediyor) = 36/100 = 0,36 .

Belirli bir kişinin erkek olduğu göz önüne alındığında beyzbolu tercih etme olasılığı

  • P (beyzbolu tercih ediyor | erkek) = 13/48 = 0,2708 .

P(beyzbolu tercih ediyor) P(beyzbolu tercih ediyor | erkek) eşit olmadığından, spor tercihi ve cinsiyetin rastgele değişkenleri bağımsız değildir .

Koşullu dağılımları neden kullanmalısınız?

Koşullu olasılık dağılımları faydalıdır çünkü sıklıkla iki değişken (cinsiyet ve spor tercihleri gibi) için veri topluyoruz, ancak değişkenlerden birinin değerini bildiğimizde olasılık hakkındaki soruları yanıtlamak istiyoruz.

Önceki örnekte, belirli bir bireyin erkek olduğunu bildiğimiz ve bu bireyin beyzbolu tercih etme olasılığını bilmek istediğimiz senaryoyu değerlendirdik.

Gerçek hayatta bir değişkenin değerini bildiğimiz ve başka bir değişkenin belirli bir değeri alma olasılığını bulmak için koşullu dağılım kullanabileceğimiz birçok durum vardır.

Ek kaynaklar

Marjinal dağılım nedir?
Ortak olasılık dağılımı nedir?
Çift girişli bir tabloda koşullu bağıl frekans nasıl bulunur?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir