Cdf veya pdf: fark nedir?
Bu eğitici istatistikte PDF (olasılık yoğunluk fonksiyonu) ile CDF (kümülatif dağılım fonksiyonu) arasındaki farkın basit bir açıklamasını sağlar.
Rastgele değişkenler
Bir PDF veya CDF’yi tanımlamadan önce rastgele değişkenleri anlamamız gerekir.
Genellikle X ile gösterilen rastgele değişken , değerleri rastgele bir sürecin sayısal sonuçları olan bir değişkendir. İki tür rastgele değişken vardır: kesikli ve sürekli.
Ayrık rastgele değişkenler
Ayrık bir rastgele değişken, yalnızca 0, 1, 2, 3, 4, 5… 100, 1 milyon vb. gibi sayılabilir sayıda farklı değer alabilen bir değişkendir. Ayrık rastgele değişkenlere bazı örnekler:
- Bir paranın 20 kez atılmasından sonra yazı gelme sayısı.
- Bir zarın 100 kez atıldıktan sonra 4 rakamına gelme sayısı.
Sürekli rastgele değişkenler
Sürekli rastgele değişken, sonsuz sayıda olası değer alabilen bir değişkendir. Sürekli rastgele değişkenlere bazı örnekler:
- Bir kişinin yüksekliği
- Bir hayvanın ağırlığı
- Bir Mil Yürümek İçin Geçen Zaman
Örneğin, bir kişinin boyu 60,2 inç, 65,2344 inç, 70,431222 inç vb. olabilir. Boyut için sonsuz sayıda olası değer vardır.
Genel kural: Eğer sonuçların sayısını sayabiliyorsanız , o zaman ayrı bir rastgele değişkenle çalışıyorsunuz demektir (örneğin, bir madalyonun kaç kez tura geldiğini saymak). Ancak sonucu ölçebiliyorsanız , sürekli bir rastgele değişkenle (örneğin ölçüm, boy, ağırlık, zaman vb.) çalışıyorsunuz demektir.
Olasılık yoğunluk fonksiyonları
Olasılık yoğunluk fonksiyonu (pdf) bize rastgele bir değişkenin belirli bir değeri alma olasılığını anlatır.
Örneğin bir zarı bir kez attığımızı varsayalım. Zarın üzerine geldiği sayıyı x olarak kabul edersek, sonuç için olasılık yoğunluk fonksiyonu şu şekilde tanımlanabilir:
P(x < 1) : 0
P(x = 1) : 1/6
P(x = 2) : 1/6
P(x = 3) : 1/6
P(x = 4) : 1/6
P(x = 5) : 1/6
P(x = 6) : 1/6
P(x > 6) : 0
X’in yalnızca tam sayı değerleri alabildiğinden bunun ayrık bir rastgele değişken örneği olduğuna dikkat edin.
Sürekli bir rastgele değişken için, x’in tam bir değer alma olasılığı sıfır olduğundan PDF’yi doğrudan kullanamayız.
Örneğin, belirli bir restorandaki hamburgerin çeyrek pound (0,25 pound) ağırlığında olma olasılığını bilmek istediğimizi varsayalım. Ağırlık sürekli bir değişken olduğundan sonsuz sayıda değer alabilir.
Örneğin, belirli bir hamburgerin ağırlığı aslında 0,250001 pound, 0,24 pound veya 0,2488 pound olabilir. Belirli bir hamburgerin tam olarak 0,25 pound ağırlığında olma olasılığı aslında sıfırdır.
Kümülatif Dağıtım Fonksiyonları
Kümülatif dağılım fonksiyonu (cdf) bize bir rastgele değişkenin x’ten küçük veya ona eşit bir değer alma olasılığını söyler.
Örneğin bir zarı bir kez attığımızı varsayalım. Zarın üzerine geldiği sayıyı x olarak kabul edersek, sonucun kümülatif dağılım fonksiyonu şu şekilde tanımlanabilir:
P(x ≤ 0) : 0
P(x ≤ 1) : 1/6
P(x ≤ 2) : 2/6
P(x ≤ 3) : 3/6
P(x ≤ 4) : 4/6
P(x ≤ 5) : 5/6
P(x ≤ 6) : 6/6
P(x > 6) : 0
X’in 6’dan küçük veya ona eşit olma olasılığının 6/6, yani 1 olduğunu unutmayın. Bunun nedeni, zarların %100 olasılıkla 1, 2, 3, 4, 5 veya 6’ya düşmesidir.
Bu örnekte ayrı bir rastgele değişken kullanılmaktadır, ancak sürekli bir rastgele değişken için sürekli bir yoğunluk fonksiyonu da kullanılabilir.
Kümülatif dağılım fonksiyonları aşağıdaki özelliklere sahiptir:
- Bir rastgele değişkenin mümkün olan en küçük değerden daha küçük bir değer alma olasılığı sıfırdır. Örneğin bir zarın 1’den küçük bir değere gelme olasılığı sıfırdır.
- Bir rastgele değişkenin mümkün olan en büyük değerden küçük veya ona eşit bir değer alma olasılığı birdir. Örneğin bir zarın 1, 2, 3, 4, 5 veya 6 değerine gelme olasılığı birdir. Bu numaralardan birine inmesi gerekiyor.
- CDF her zaman azalmaz. Yani zarın 1’den küçük veya eşit bir sayıya düşme olasılığı 1/6, 2’den küçük veya eşit bir sayıya düşme olasılığı 2/6, zarın 1’den küçük veya eşit bir sayıya düşme olasılığı 2/6, 3’ten küçük veya ona eşit olan sayı 3/6’dır vb. Kümülatif olasılıklar her zaman azalmaz.
İlgili: Kümülatif bir dağıtım işlevini görselleştirmek için bir ojiv grafiği kullanabilirsiniz.
CDF ile PDF arasındaki ilişki
Teknik açıdan, olasılık yoğunluk fonksiyonu (pdf), kümülatif dağılım fonksiyonunun (cdf) türevidir.
Ek olarak, bir pdf eğrisinin altında negatif sonsuzluk ile x arasındaki alan, cdf’deki x değerine eşittir.
Bir pdf ile bir cdf arasındaki ilişkinin kapsamlı bir açıklaması ve ayrıca pdf’in neden cdf’nin türevi olduğunun kanıtı için bir istatistik ders kitabına bakın.