Olasılık dağılım türleri
Bu makale istatistikteki farklı olasılık dağılımlarını açıklamaktadır. Böylece kaç çeşit olasılık dağılımı olduğunu ve aralarındaki farkların neler olduğunu öğreneceksiniz.
Olasılık dağılım türleri nelerdir?
Olasılık dağılım türleri şunlardır:
- Ayrık olasılık dağılımları :
- Ayrık düzgün dağılım .
- Bernoulli dağılımı .
- Binom dağılımı .
- Balık dağıtımı .
- Çok terimli dağılım .
- Geometrik dağılım .
- Negatif binom dağılımı .
- Hipergeometrik dağılım .
- Sürekli olasılık dağılımları :
- Düzgün ve sürekli dağıtım .
- Normal dağılım .
- Lognormal dağılım .
- Ki-kare dağılımı .
- Öğrencinin t dağılımı .
- Dağıtım Snedecor F.
- Üstel dağılım .
- Beta dağıtımı .
- Gama dağılımı .
- Weibull dağıtımı .
- Pareto dağılımı .
Her bir olasılık dağılımı türü aşağıda ayrıntılı olarak açıklanmaktadır.
Ayrık olasılık dağılımları
Ayrık bir olasılık dağılımı, ayrı bir rastgele değişkenin olasılıklarını tanımlayan dağılımdır. Bu nedenle ayrık bir olasılık dağılımı yalnızca sonlu sayıda değer (genellikle tamsayı değerler) alabilir.
Ayrık düzgün dağılım
Ayrık tekdüze dağılım, tüm değerlerin eş olasılıklı olduğu, yani ayrık bir tekdüze dağılımda tüm değerlerin aynı oluşma olasılığına sahip olduğu ayrı bir olasılık dağılımıdır.
Örneğin, tüm olası sonuçların (1, 2, 3, 4, 5 veya 6) aynı oluşma olasılığına sahip olması nedeniyle, bir zarın atılması ayrık ve düzgün bir dağılımla tanımlanabilir.
Genel olarak, ayrık bir düzgün dağılım, dağılımın alabileceği olası değerlerin aralığını tanımlayan a ve b olmak üzere iki karakteristik parametreye sahiptir. Bu nedenle, bir değişken ayrık bir düzgün dağılımla tanımlandığında, Düzgün(a,b) olarak yazılır.
Ayrık tekdüze dağılım, rastgele deneyleri tanımlamak için kullanılabilir, çünkü tüm sonuçlar aynı olasılığa sahipse, bu, deneyde rastgelelik olduğu anlamına gelir.
Bernoulli dağılımı
İkili dağılım olarak da bilinen Bernoulli dağılımı , yalnızca iki sonuca sahip olabilen ayrı bir değişkeni temsil eden bir olasılık dağılımıdır: “başarı” veya “başarısızlık”.
Bernoulli dağılımında “başarı” beklediğimiz sonuçtur ve 1 değerine sahipken, “başarısızlık” sonucu beklenenin dışında bir sonuçtur ve 0 değerine sahiptir. başarı” p , “başarısızlık” sonucunun olasılığı q=1-p’dir .
Bernoulli dağılımı ismini İsviçreli istatistikçi Jacob Bernoulli’den almıştır.
İstatistikte, Bernoulli dağılımının esas olarak tek bir uygulaması vardır: yalnızca iki olası sonucun (başarı ve başarısızlık) olduğu deneylerin olasılıklarını tanımlamak. Dolayısıyla Bernoulli dağılımını kullanan bir deneye Bernoulli testi veya Bernoulli deneyi denir.
Binom dağılımı
Binom dağılımı olarak da adlandırılan binom dağılımı , sabit bir başarı olasılığı ile bir dizi bağımsız, ikili deney gerçekleştirirken elde edilen başarıların sayısını sayan bir olasılık dağılımıdır. Başka bir deyişle binom dağılımı, bir dizi Bernoulli denemesinin başarılı sonuçlarının sayısını tanımlayan bir dağılımdır.
Örneğin, bir madalyonun 25 kez tura gelme sayısı binom dağılımıdır.
Genel olarak gerçekleştirilen deneylerin toplam sayısı n parametresi ile tanımlanırken, p her deneyin başarı olasılığıdır. Böylece, binom dağılımını takip eden bir rastgele değişken şu şekilde yazılır:
Binom dağılımında, tam olarak aynı deneyin n kez tekrarlandığını ve deneylerin birbirinden bağımsız olduğunu, dolayısıyla her deneyin başarı olasılığının aynı olduğunu (p) unutmayın.
Balık dağıtımı
Poisson dağılımı, belirli bir süre içinde belirli sayıda olayın meydana gelme olasılığını tanımlayan bir olasılık dağılımıdır. Başka bir deyişle Poisson dağılımı, bir olgunun belirli bir zaman aralığında tekrarlanma sayısını tanımlayan rastgele değişkenleri modellemek için kullanılır.
Örneğin, bir telefon santralinin dakika başına aldığı çağrı sayısı, Poisson dağılımı kullanılarak tanımlanabilen ayrı bir rastgele değişkendir.
Poisson dağılımının, Yunanca λ harfiyle temsil edilen karakteristik bir parametresi vardır ve incelenen olayın belirli bir aralıkta kaç kez meydana gelmesinin beklendiğini gösterir.
çok terimli dağılım
Çok terimli dağılım (veya çok terimli dağılım ), birden fazla deneme gerçekleştirildikten sonra belirli sayıda meydana gelen birden fazla özel olayın olasılığını tanımlayan bir olasılık dağılımıdır.
Yani, rastgele bir deney üç veya daha fazla özel olayla sonuçlanabiliyorsa ve her olayın ayrı ayrı meydana gelme olasılığı biliniyorsa, çok terimli dağılım, birden fazla deney gerçekleştirildiğinde belirli sayıda olayın meydana gelme olasılığını hesaplamak için kullanılır. her olayın katı.
Dolayısıyla çok terimli dağılım, binom dağılımının bir genellemesidir.
geometrik dağılım
Geometrik dağılım, ilk başarılı sonucu elde etmek için gereken Bernoulli denemelerinin sayısını tanımlayan bir olasılık dağılımıdır. Yani, Bernoulli deneylerinden biri pozitif sonuç elde edene kadar tekrarlanan süreçlerin geometrik dağılım modelleri.
Örneğin otoyolda sarı bir araba görene kadar geçen araba sayısı geometrik bir dağılımdır.
Bernoulli testinin iki olası sonucu olan bir deney olduğunu unutmayın: “başarı” ve “başarısızlık”. Yani “başarı” olasılığı p ise, “başarısızlık” olasılığı q=1-p’dir .
Bu nedenle geometrik dağılım, yapılan tüm deneylerin başarı olasılığı olan p parametresine bağlıdır. Ayrıca p olasılığı tüm deneyler için aynıdır.
negatif binom dağılımı
Negatif binom dağılımı, belirli sayıda pozitif sonuç elde etmek için gereken Bernoulli denemelerinin sayısını tanımlayan bir olasılık dağılımıdır.
Bu nedenle, negatif bir binom dağılımının iki karakteristik parametresi vardır: r , istenen başarılı sonuç sayısıdır ve p , gerçekleştirilen her Bernoulli deneyinin başarı olasılığıdır.
Dolayısıyla negatif binom dağılımı, pozitif sonuçlar elde etmek için gerektiği kadar Bernoulli denemesinin yapıldığı bir süreci tanımlar. Ayrıca, tüm bu Bernoulli denemeleri bağımsızdır ve sabit bir başarı olasılığına sahiptir.
Örneğin, negatif binom dağılımını izleyen bir rastgele değişken, 6 sayısı üç katına çıkana kadar bir zarın kaç kez atılması gerektiğidir.
hipergeometrik dağılım
Hipergeometrik dağılım, bir popülasyondan n öğenin değiştirilmesi gerekmeden rastgele bir çıkarma işlemindeki başarılı vakaların sayısını tanımlayan bir olasılık dağılımıdır.
Yani hipergeometrik dağılım, bir popülasyondan herhangi birini değiştirmeden n öğe çıkarırken x başarı elde etme olasılığını hesaplamak için kullanılır.
Bu nedenle hipergeometrik dağılımın üç parametresi vardır:
- N : popülasyondaki elementlerin sayısıdır (N = 0, 1, 2,…).
- K : Maksimum başarı durumu sayısıdır (K = 0, 1, 2,…,N). Hipergeometrik bir dağılımda bir öğe yalnızca “başarılı” veya “başarısızlık” olarak değerlendirilebileceğinden, NK maksimum başarısızlık durumu sayısıdır.
- n : gerçekleştirilen değiştirilmeden getirme sayısıdır.
Sürekli olasılık dağılımları
Sürekli olasılık dağılımı, ondalık değerler de dahil olmak üzere bir aralıktaki herhangi bir değeri alabilen dağılımdır. Bu nedenle sürekli bir olasılık dağılımı, sürekli bir rastgele değişkenin olasılıklarını tanımlar.
düzgün ve sürekli dağıtım
Dikdörtgen dağılım olarak da adlandırılan sürekli düzgün dağılım , tüm değerlerin aynı oluşma olasılığına sahip olduğu bir sürekli olasılık dağılımı türüdür. Başka bir deyişle sürekli düzgün dağılım, olasılığın belirli bir aralıkta düzgün dağıldığı bir dağılımdır.
Sürekli düzgün dağılım, sabit olasılığa sahip sürekli değişkenleri tanımlamak için kullanılır. Benzer şekilde, rastgele süreçleri tanımlamak için sürekli tekdüze dağılım kullanılır, çünkü tüm sonuçların aynı olasılığa sahip olması, sonuçta rastgelelik olduğu anlamına gelir.
Sürekli düzgün dağılım, eş olasılık aralığını tanımlayan a ve b olmak üzere iki karakteristik parametreye sahiptir. Dolayısıyla sürekli düzgün dağılımın sembolü U(a,b)’ dir; burada a ve b , dağılımın karakteristik değerleridir.
Örneğin, rastgele bir deneyin sonucu 5 ile 9 arasında herhangi bir değer alabiliyorsa ve olası tüm sonuçların gerçekleşme olasılığı aynıysa, deney sürekli düzgün dağılım U(5.9) ile simüle edilebilir.
Normal dağılım
Normal dağılım, grafiği çan şeklinde ve ortalamasına göre simetrik olan sürekli bir olasılık dağılımıdır. İstatistikte normal dağılım çok farklı özelliklere sahip olguları modellemek için kullanılır, bu nedenle bu dağılım çok önemlidir.
Aslında istatistikte normal dağılım, tüm olasılık dağılımları arasında açık ara en önemli dağılım olarak kabul edilir, çünkü sadece çok sayıda gerçek olgunun modellenmesine değil, aynı zamanda diğer dağılım türlerine yaklaşık olarak normal dağılım kullanılmasına da olanak tanır. belirli koşullar altında.
Normal dağılımın sembolü büyük harf N’dir. Yani bir değişkenin normal dağılım izlediğini belirtmek için N harfi ile gösterilir ve parantez içinde aritmetik ortalaması ve standart sapması değerleri eklenir.
Normal dağılımın Gauss dağılımı , Gauss dağılımı ve Laplace-Gauss dağılımı dahil olmak üzere birçok farklı adı vardır.
Lognormal dağılım
Lognormal dağılım veya lognormal dağılım , logaritması normal dağılıma uyan rastgele bir değişkeni tanımlayan bir olasılık dağılımıdır.
Bu nedenle, eğer X değişkeni normal dağılıma sahipse, üstel fonksiyon e x lognormal dağılıma sahiptir.
Logaritmanın yalnızca bir pozitif argüman alan bir fonksiyon olması nedeniyle lognormal dağılımın yalnızca değişken değerleri pozitif olduğunda kullanılabileceğini unutmayın.
Lognormal dağılımın istatistikteki farklı uygulamaları arasında, bu dağılımın finansal yatırımları analiz etmek ve güvenilirlik analizleri yapmak için kullanılmasını öne çıkarıyoruz.
Lognormal dağılım aynı zamanda Tinaut dağılımı olarak da bilinir ve bazen lognormal dağılım veya log-normal dağılım olarak da yazılır.
Ki-kare dağılımı
Ki-kare dağılımı sembolü χ² olan bir olasılık dağılımıdır. Daha kesin olarak Ki-kare dağılımı, normal dağılıma sahip k bağımsız rastgele değişkenin karelerinin toplamıdır.
Dolayısıyla Ki-kare dağılımı k serbestlik derecesine sahiptir. Bu nedenle, bir Ki-kare dağılımı, temsil ettiği normal dağılımlı değişkenlerin karelerinin toplamı kadar serbestlik derecesine sahiptir.
Ki-kare dağılımı Pearson dağılımı olarak da bilinir.
Ki-kare dağılımı istatistiksel çıkarımlarda, örneğin hipotez testlerinde ve güven aralıklarında yaygın olarak kullanılır. Aşağıda bu tür olasılık dağılımının uygulamalarının neler olduğunu göreceğiz.
Öğrencinin t dağılımı
Öğrenci t dağılımı istatistikte yaygın olarak kullanılan bir olasılık dağılımıdır. Özellikle, Öğrenci t dağılımı, iki numunenin ortalamaları arasındaki farkı belirlemek ve güven aralıklarını oluşturmak için Öğrenci t testinde kullanılır.
Öğrencinin t dağılımı, istatistikçi William Sealy Gosset tarafından 1908 yılında “Öğrenci” takma adı altında geliştirildi.
Öğrencinin t dağılımı, toplam gözlem sayısından bir birimin çıkarılmasıyla elde edilen serbestlik derecesi sayısıyla tanımlanır. Bu nedenle, Öğrenci t dağılımının serbestlik derecesini belirleme formülü ν=n-1’dir .
Snedecor F Dağıtımı
Fisher-Snedecor F dağılımı veya basitçe F dağılımı olarak da adlandırılan Snedecor F dağılımı, istatistiksel çıkarımda, özellikle varyans analizinde kullanılan sürekli bir olasılık dağılımıdır.
Snedecor F dağılımının özelliklerinden biri, serbestlik derecesini gösteren m ve n olmak üzere iki gerçek parametrenin değeriyle tanımlanmasıdır. Dolayısıyla Snedecor dağılımı F’nin sembolü Fm ,n’dir ; burada m ve n , dağılımı tanımlayan parametrelerdir.
Fisher-Snedecor F dağılımı, adını İngiliz istatistikçi Ronald Fisher ve Amerikalı istatistikçi George Snedecor’dan almaktadır.
İstatistikte Fisher-Snedecor F dağılımının farklı uygulamaları vardır. Örneğin, Fisher-Snedecor F dağılımı farklı doğrusal regresyon modellerini karşılaştırmak için kullanılır ve bu olasılık dağılımı, varyans analizinde (ANOVA) kullanılır.
Üstel dağılım
Üstel dağılım, rastgele bir olayın meydana gelmesi için bekleme süresini modellemek için kullanılan sürekli bir olasılık dağılımıdır.
Daha doğrusu üstel dağılım, Poisson dağılımını takip eden iki olay arasındaki bekleme süresini tanımlamamıza olanak tanır. Bu nedenle üstel dağılım Poisson dağılımıyla yakından ilişkilidir.
Üstel dağılım, Yunan harfi λ ile temsil edilen karakteristik bir parametreye sahiptir ve incelenen olayın belirli bir süre içinde kaç kez meydana gelmesinin beklendiğini gösterir.
Benzer şekilde üstel dağılım da bir arıza meydana gelene kadar geçen süreyi modellemek için kullanılır. Bu nedenle üstel dağılımın güvenilirlik ve hayatta kalma teorisinde çeşitli uygulamaları vardır.
Beta Dağılımı
Beta dağılımı, (0,1) aralığında tanımlanan ve iki pozitif parametreyle parametrelendirilen bir olasılık dağılımıdır: α ve β. Yani beta dağılımının değerleri α ve β parametrelerine bağlıdır.
Bu nedenle değeri 0 ile 1 arasında değişen sürekli rastgele değişkenleri tanımlamak için beta dağılımı kullanılır.
Sürekli bir rastgele değişkenin beta dağılımı tarafından yönetildiğini gösteren çeşitli gösterimler vardır, en yaygın olanları şunlardır:
İstatistikte beta dağılımının çok çeşitli uygulamaları vardır. Örneğin beta dağılımı, farklı örneklerdeki yüzde değişimlerini incelemek için kullanılır. Benzer şekilde proje yönetiminde Pert analizini gerçekleştirmek için beta dağıtımı kullanılır.
Gama dağılımı
Gama dağılımı, iki karakteristik parametre olan α ve λ ile tanımlanan sürekli bir olasılık dağılımıdır. Başka bir deyişle, gama dağılımı iki parametresinin değerine bağlıdır: α şekil parametresidir ve λ ölçek parametresidir.
Gama dağılımının sembolü büyük Yunan harfi Γ’dir. Yani bir rastgele değişken gama dağılımını takip ediyorsa şu şekilde yazılır:
Gama dağılımı ayrıca şekil parametresi k = α ve ters ölçek parametresi θ = 1/λ kullanılarak parametrelendirilebilir. Her durumda gama dağılımını tanımlayan iki parametre pozitif gerçek sayılardır.
Tipik olarak gama dağılımı sağa çarpık veri kümelerini modellemek için kullanılır, böylece grafiğin sol tarafında daha fazla veri konsantrasyonu olur. Örneğin, gama dağılımı elektrikli bileşenlerin güvenilirliğini modellemek için kullanılır.
Weibull dağılımı
Weibull dağılımı iki karakteristik parametreyle tanımlanan sürekli bir olasılık dağılımıdır: şekil parametresi α ve ölçek parametresi λ.
İstatistiklerde Weibull dağılımı esas olarak hayatta kalma analizi için kullanılır. Aynı şekilde Weibull dağılımının da farklı alanlarda birçok uygulaması bulunmaktadır.
Yazarlara göre Weibull dağılımı üç parametreyle de parametrelendirilebilir. Daha sonra dağılım grafiğinin başladığı apsisi gösteren eşik değeri adı verilen üçüncü bir parametre eklenir.
Weibull dağılımı, adını 1951 yılında onu ayrıntılı olarak açıklayan İsveçli Waloddi Weibull’dan almıştır. Ancak Weibull dağılımı 1927 yılında Maurice Fréchet tarafından keşfedilmiş ve ilk olarak 1933 yılında Rosin ve Rammler tarafından uygulanmıştır.
Pareto dağılımı
Pareto dağılımı, istatistikte Pareto ilkesini modellemek için kullanılan sürekli bir olasılık dağılımıdır. Dolayısıyla Pareto dağılımı, gerçekleşme olasılığı diğer değerlerden çok daha yüksek olan birkaç değere sahip bir olasılık dağılımıdır.
80-20 kuralı olarak da adlandırılan Pareto yasasının, bir olgunun nedeninin çoğunun nüfusun küçük bir kısmından kaynaklandığını söyleyen istatistiksel bir ilke olduğunu unutmayın.
Pareto dağılımının iki karakteristik parametresi vardır: ölçek parametresi x m ve şekil parametresi α.
Başlangıçta Pareto dağılımı, nüfusun küçük bir kısmından kaynaklandığı için nüfus içindeki zenginlik dağılımını tanımlamak için kullanılıyordu. Ancak şu anda Pareto dağılımının birçok uygulaması vardır; örneğin kalite kontrolde, ekonomide, bilimde, sosyal alanda vb.