Olasılık dağılımı

Bu makale istatistikte olasılık dağılımlarının ne olduğunu açıklamaktadır. Böylece olasılık dağılımının tanımını, olasılık dağılımı örneklerini ve farklı olasılık dağılım türlerini bulacaksınız.

Olasılık dağılımı nedir?

Olasılık dağılımı, bir rastgele değişkenin her değerinin ortaya çıkma olasılığını tanımlayan bir fonksiyondur. Basitçe söylemek gerekirse olasılık dağılımı, rastgele bir deneyin tüm olası sonuçlarının olasılıklarını tanımlayan matematiksel bir fonksiyondur.

Örneğin, izin ver

Bu nedenle olasılık dağılımları, bir örnek uzaydaki farklı olayların olasılıklarını hesaplamak için kullanıldıkları için olasılık teorisinde ve istatistikte sıklıkla kullanılır.

Olasılık dağılım türleri

Olasılık dağılımları iki geniş türe ayrılabilir: kesikli dağılımlar ve sürekli dağılımlar.

  • Ayrık olasılık dağılımı: Dağılım bir aralıkta yalnızca sayılabilir sayıda değer alabilir. Normalde ayrık olasılık dağılımları yalnızca tam sayı değerleri alabilir, yani ondalık basamakları yoktur.
  • Sürekli olasılık dağılımı: Dağılım bir aralıkta sonsuz sayıda değer alabilir. Genel olarak sürekli olasılık dağılımları ondalık değerler alabilir.

Ayrık olasılık dağılımları

Ayrık bir olasılık dağılımı, ayrı bir rastgele değişkenin olasılıklarını tanımlayan dağılımdır. Bu nedenle ayrık bir olasılık dağılımı yalnızca sonlu sayıda değer (genellikle tamsayı değerler) alabilir.

Ayrık düzgün dağılım

Ayrık tekdüze dağılım, tüm değerlerin eş olasılıklı olduğu, yani ayrık bir tekdüze dağılımda tüm değerlerin aynı oluşma olasılığına sahip olduğu ayrı bir olasılık dağılımıdır.

Örneğin, tüm olası sonuçların (1, 2, 3, 4, 5 veya 6) aynı oluşma olasılığına sahip olması nedeniyle, bir zarın atılması ayrık ve düzgün bir dağılımla tanımlanabilir.

Genel olarak, ayrık bir düzgün dağılım, dağılımın alabileceği olası değerlerin aralığını tanımlayan a ve b olmak üzere iki karakteristik parametreye sahiptir. Bu nedenle, bir değişken ayrık bir düzgün dağılımla tanımlandığında, Düzgün(a,b) olarak yazılır.

X\sim \text{Uniforme}(a,b)

Ayrık tekdüze dağılım, rastgele deneyleri tanımlamak için kullanılabilir çünkü tüm sonuçların aynı olasılığa sahip olması, deneyin rastgele olduğu anlamına gelir.

Daha fazlasını öğrenin: Ayrık tekdüze dağılım

Bernoulli dağılımı

İkili dağılım olarak da bilinen Bernoulli dağılımı , yalnızca iki sonuca sahip olabilen ayrı bir değişkeni temsil eden bir olasılık dağılımıdır: “başarı” veya “başarısızlık”.

Bernoulli dağılımında “başarı” beklediğimiz sonuçtur ve 1 değerine sahipken, “başarısızlık” sonucu beklenenin dışında bir sonuçtur ve 0 değerine sahiptir. başarı” p , “başarısızlık” sonucunun olasılığı q=1-p’dir .

\begin{array}{c}X\sim \text{Bernoulli}(p)\\[2ex]\begin{array}{l} \text{\'Exito}\ \color{orange}\bm{\longrightarrow}\color{black} \ P[X=1]=p\\[2ex]\text{Fracaso}\ \color{orange}\bm{\longrightarrow}\color{black} \ P[X=0]=q=1-p\end{array}\end{array}

Bernoulli dağılımı ismini İsviçreli istatistikçi Jacob Bernoulli’den almıştır.

İstatistikte, Bernoulli dağılımının esas olarak tek bir uygulaması vardır: yalnızca iki olası sonucun (başarı ve başarısızlık) olduğu deneylerin olasılıklarını tanımlamak. Dolayısıyla Bernoulli dağılımını kullanan bir deneye Bernoulli testi veya Bernoulli deneyi denir.

Daha fazlasını öğrenmek için: Bernoulli dağılımı

Binom dağılımı

Binom dağılımı olarak da adlandırılan binom dağılımı , sabit bir başarı olasılığı ile bir dizi bağımsız, ikili deney gerçekleştirirken elde edilen başarıların sayısını sayan bir olasılık dağılımıdır. Başka bir deyişle binom dağılımı, bir dizi Bernoulli denemesinin başarılı sonuçlarının sayısını tanımlayan bir dağılımdır.

Örneğin, bir paranın 25 kez atılması sırasında ortaya çıkan “tura” sayısı binom dağılımıdır.

Genel olarak gerçekleştirilen deneylerin toplam sayısı n parametresi ile tanımlanırken, p her deneyin başarı olasılığıdır. Böylece, binom dağılımını takip eden bir rastgele değişken şu şekilde yazılır:

X\sim\text{Bin}(n,p)

Binom dağılımında aynı deneyin n kez tekrarlandığını ve deneylerin birbirinden bağımsız olduğunu, dolayısıyla her deneyin başarı olasılığının aynı olduğunu (p) unutmayın.

Daha fazlasını öğrenin: Binom dağılımı

Balık dağıtımı

Poisson dağılımı, belirli bir süre boyunca belirli sayıda olayın meydana gelme olasılığını tanımlayan bir olasılık dağılımıdır. Başka bir deyişle Poisson dağılımı, bir olgunun belirli bir zaman aralığında tekrarlanma sayısını tanımlayan rastgele değişkenleri modellemek için kullanılır.

Örneğin, bir telefon santralinin dakika başına aldığı çağrı sayısı, Poisson dağılımı kullanılarak tanımlanabilen ayrı bir rastgele değişkendir.

Poisson dağılımının, Yunanca λ harfiyle temsil edilen karakteristik bir parametresi vardır ve incelenen olayın belirli bir aralıkta kaç kez meydana gelmesinin beklendiğini gösterir.

X\sim \text{Poisson}(\lambda)

Daha fazlasını öğrenmek için: Balık Dağıtımı

çok terimli dağılım

Çok terimli dağılım (veya çok terimli dağılım ), birbirini dışlayan birkaç olayın birkaç denemeden sonra belirli sayıda meydana gelme olasılığını tanımlayan bir olasılık dağılımıdır.

Yani, rastgele bir deney üç veya daha fazla özel olayla sonuçlanabiliyorsa ve her olayın ayrı ayrı meydana gelme olasılığı biliniyorsa, çok terimli dağılım, birden fazla deney gerçekleştirildiğinde belirli sayıda olayın meydana gelme olasılığını hesaplamak için kullanılır. her zaman.

Dolayısıyla çok terimli dağılım, binom dağılımının bir genellemesidir.

Daha fazlasını öğrenin: Çok terimli dağılım

geometrik dağılım

Geometrik dağılım, ilk başarılı sonucu elde etmek için gereken Bernoulli denemelerinin sayısını tanımlayan bir olasılık dağılımıdır. Yani, Bernoulli deneylerinden biri pozitif sonuç elde edene kadar tekrarlanan süreçlerin geometrik dağılım modelleri.

Örneğin otoyolda sarı bir araba görene kadar geçen araba sayısı geometrik bir dağılımdır.

Bernoulli testinin iki olası sonucu olan bir deney olduğunu unutmayın: “başarı” ve “başarısızlık”. Yani “başarı” olasılığı p ise, “başarısızlık” olasılığı q=1-p’dir .

Bu nedenle geometrik dağılım, gerçekleştirilen tüm deneylerin başarı olasılığı olan p parametresine bağlıdır. Ayrıca p olasılığı tüm deneyler için aynıdır.

X\sim\text{Geom\'etrica}(p)

Daha fazlasını öğrenin: Geometrik dağılım

negatif binom dağılımı

Negatif binom dağılımı, belirli sayıda pozitif sonuç elde etmek için gereken Bernoulli denemelerinin sayısını tanımlayan bir olasılık dağılımıdır.

Bu nedenle, negatif bir binom dağılımının iki karakteristik parametresi vardır: r , istenen başarılı sonuçların sayısıdır ve p , gerçekleştirilen her Bernoulli deneyinin başarı olasılığıdır.

X\sim \text{BN}(r,p)

Dolayısıyla negatif binom dağılımı, pozitif sonuçlar elde etmek için gerektiği kadar Bernoulli denemesinin yapıldığı bir süreci tanımlar. Ayrıca, tüm bu Bernoulli denemeleri bağımsızdır ve sabit bir başarı olasılığına sahiptir.

Örneğin, negatif binom dağılımını takip eden rastgele bir değişken, 6 sayısı üç kez atılana kadar bir zarın kaç kez atılması gerektiğidir.

Daha fazlasını öğrenin: Negatif binom dağılımı

hipergeometrik dağılım

Hipergeometrik dağılım, bir popülasyondan n öğenin değiştirilmesi gerekmeden rastgele bir çıkarma işlemindeki başarılı vakaların sayısını tanımlayan bir olasılık dağılımıdır.

Yani hipergeometrik dağılım, bir popülasyondan herhangi birini değiştirmeden n öğe çıkarırken x başarı elde etme olasılığını hesaplamak için kullanılır.

Bu nedenle hipergeometrik dağılımın üç parametresi vardır:

  • N : popülasyondaki elementlerin sayısıdır (N = 0, 1, 2,…).
  • K : Maksimum başarı durumu sayısıdır (K = 0, 1, 2,…,N). Hipergeometrik bir dağılımda bir öğe yalnızca “başarılı” veya “başarısızlık” olarak değerlendirilebileceğinden, NK maksimum başarısızlık durumu sayısıdır.
  • n : gerçekleştirilen değiştirilmeden getirme sayısıdır.

X \sim HG(N,K,n)

Daha fazlasını öğrenmek için: Hipergeometrik dağılım

Sürekli olasılık dağılımları

Sürekli olasılık dağılımı, ondalık değerler de dahil olmak üzere bir aralıktaki herhangi bir değeri alabilen dağılımdır. Bu nedenle sürekli bir olasılık dağılımı, sürekli bir rastgele değişkenin olasılıklarını tanımlar.

düzgün ve sürekli dağıtım

Dikdörtgen dağılım olarak da adlandırılan sürekli düzgün dağılım , tüm değerlerin aynı görünme olasılığına sahip olduğu bir sürekli olasılık dağılımı türüdür. Başka bir deyişle sürekli düzgün dağılım, olasılığın belirli bir aralıkta düzgün dağıldığı bir dağılımdır.

Sürekli düzgün dağılım, sabit olasılığa sahip sürekli değişkenleri tanımlamak için kullanılır. Benzer şekilde, rastgele süreçleri tanımlamak için sürekli tekdüze dağılım kullanılır, çünkü tüm sonuçların aynı olasılığa sahip olması, sonuçta rastgelelik olduğu anlamına gelir.

Sürekli düzgün dağılım, eş olasılık aralığını tanımlayan a ve b olmak üzere iki karakteristik parametreye sahiptir. Dolayısıyla sürekli düzgün dağılımın sembolü U(a,b)’ dir; burada a ve b , dağılımın karakteristik değerleridir.

X\sim U(a,b)

Örneğin, rastgele bir deneyin sonucu 5 ile 9 arasında herhangi bir değer alabiliyorsa ve olası tüm sonuçların gerçekleşme olasılığı aynıysa, deney sürekli düzgün dağılım U(5.9) ile simüle edilebilir.

Daha fazlasını öğrenin: Sürekli eşit dağılım

Normal dağılım

Normal dağılım, grafiği çan şeklinde ve ortalamasına göre simetrik olan sürekli bir olasılık dağılımıdır. İstatistikte normal dağılım çok farklı özelliklere sahip olguları modellemek için kullanılır, bu nedenle bu dağılım çok önemlidir.

Aslında istatistikte normal dağılım, tüm olasılık dağılımları arasında açık ara en önemli dağılım olarak kabul edilir, çünkü sadece çok sayıda gerçek dünya olayını modellemekle kalmaz, aynı zamanda normal dağılım diğer olasılık türlerine yaklaşık olarak da kullanılabilir. dağıtımlar. belirli koşullar altında.

Normal dağılımın sembolü büyük harf N’dir. Yani bir değişkenin normal dağılım izlediğini belirtmek için N harfi ile gösterilir ve parantez içinde aritmetik ortalaması ve standart sapması değerleri eklenir.

X\sim N(\mu,\sigma)

Normal dağılımın Gauss dağılımı , Gauss dağılımı ve Laplace-Gauss dağılımı dahil olmak üzere birçok farklı adı vardır.

Daha fazlasını öğrenin: Normal dağılım

Lognormal dağılım

Lognormal dağılım veya lognormal dağılım , logaritması normal dağılıma uyan rastgele bir değişkeni tanımlayan bir olasılık dağılımıdır.

Bu nedenle, eğer X değişkeni normal dağılıma sahipse, üstel fonksiyon e x lognormal dağılıma sahiptir.

X\sim \text{Lognormal}(\mu,\sigma^2)

Logaritmanın yalnızca bir pozitif argümanı kabul eden bir fonksiyon olması nedeniyle lognormal dağılımın yalnızca değişkenin değerleri pozitif olduğunda kullanılabileceğini unutmayın.

Lognormal dağılımın istatistikteki farklı uygulamaları arasında, bu dağılımın finansal yatırımları analiz etmek ve güvenilirlik analizleri yapmak için kullanılmasını öne çıkarıyoruz.

Lognormal dağılım aynı zamanda Tinaut dağılımı olarak da bilinir ve bazen lognormal dağılım veya log-normal dağılım olarak da yazılır.

Daha fazlasını öğrenin: Lognormal dağılım

Ki-kare dağılımı

Ki-kare dağılımı sembolü χ² olan bir olasılık dağılımıdır. Daha kesin olarak Ki-kare dağılımı, normal dağılıma sahip k bağımsız rastgele değişkenin karelerinin toplamıdır.

Dolayısıyla Ki-kare dağılımı k serbestlik derecesine sahiptir. Bu nedenle, bir Ki-kare dağılımı, temsil ettiği normal dağılımlı değişkenlerin karelerinin toplamı kadar serbestlik derecesine sahiptir.

\displaystyle X\sim\chi^2_k \ \color{orange}\bm{\longrightarrow}\color{black}\ \begin{array}{l}\text{Distribuci\'on chi-cuadrado}\\[2ex]\text{con k grados de libertad}\end{array}

Ki-kare dağılımı Pearson dağılımı olarak da bilinir.

Ki-kare dağılımı istatistiksel çıkarımlarda, örneğin hipotez testlerinde ve güven aralıklarında yaygın olarak kullanılır. Aşağıda bu tür olasılık dağılımının uygulamalarının neler olduğunu göreceğiz.

Daha fazlasını öğrenmek için: Ki kare dağılımı

Öğrencinin t dağılımı

Öğrenci t dağılımı istatistikte yaygın olarak kullanılan bir olasılık dağılımıdır. Özellikle, Öğrenci t dağılımı, iki numunenin ortalamaları arasındaki farkı belirlemek ve güven aralıklarını oluşturmak için Öğrenci t testinde kullanılır.

Öğrencinin t dağılımı, istatistikçi William Sealy Gosset tarafından 1908 yılında “Öğrenci” takma adı altında geliştirildi.

Öğrencinin t dağılımı, toplam gözlem sayısından bir birimin çıkarılmasıyla elde edilen serbestlik derecesi sayısıyla tanımlanır. Bu nedenle, Öğrenci t dağılımının serbestlik derecesini belirleme formülü ν=n-1’dir .

\begin{array}{c}\nu=n-1\\[2ex]X\sim t_\nu\end{array}

Daha fazlasını öğrenmek için: Öğrenci dağılımı

Snedecor F Dağıtımı

Fisher-Snedecor F dağılımı veya basitçe F dağılımı olarak da adlandırılan Snedecor F dağılımı, istatistiksel çıkarımda, özellikle varyans analizinde kullanılan sürekli bir olasılık dağılımıdır.

Snedecor F dağılımının özelliklerinden biri, serbestlik derecesini gösteren m ve n olmak üzere iki gerçek parametrenin değeriyle tanımlanmasıdır. Dolayısıyla Snedecor dağılımı F’nin sembolü Fm ,n’dir ; burada m ve n , dağılımı tanımlayan parametrelerdir.

F_{m,n}\qquad m,n>0″ title=”Rendered by QuickLaTeX.com” height=”18″ width=”139″ style=”vertical-align: -6px;”></p>
</p>
<p> Matematiksel olarak Snedecor F dağılımı, bir ki-kare dağılımı ile onun serbestlik dereceleri arasındaki bölümün, başka bir ki-kare dağılımı ile onun serbestlik dereceleri arasındaki bölüme bölünmesine eşittir. Böylece Snedecor F dağılımını tanımlayan formül aşağıdaki gibidir:</p>
</p>
<p class=\left.\begin{array}{c} X\sim \chi_m^2\\[2ex] Y\sim \chi_n^2\end{array}\right\}\color{orange}\bm{\longrightarrow}\color{black}\ F_{m,n}= \cfrac{X/m}{Y/n}

Fisher-Snedecor F dağılımı, adını İngiliz istatistikçi Ronald Fisher ve Amerikalı istatistikçi George Snedecor’dan almaktadır.

İstatistikte Fisher-Snedecor F dağılımının farklı uygulamaları vardır. Örneğin, Fisher-Snedecor F dağılımı farklı doğrusal regresyon modellerini karşılaştırmak için kullanılır ve bu olasılık dağılımı, varyans analizinde (ANOVA) kullanılır.

Daha fazlasını öğrenmek için: Snedecor F Dağıtımı

üstel dağılım

Üstel dağılım, rastgele bir olayın meydana gelmesi için bekleme süresini modellemek için kullanılan sürekli bir olasılık dağılımıdır.

Daha doğrusu üstel dağılım, Poisson dağılımını takip eden iki olay arasındaki bekleme süresini tanımlamayı mümkün kılar. Bu nedenle üstel dağılım Poisson dağılımıyla yakından ilişkilidir.

Üstel dağılım, Yunan harfi λ ile temsil edilen karakteristik bir parametreye sahiptir ve incelenen olayın belirli bir süre içinde kaç kez meydana gelmesinin beklendiğini gösterir.

X\sim \text{Exp}(\lambda)

Benzer şekilde üstel dağılım da bir arıza meydana gelene kadar geçen süreyi modellemek için kullanılır. Bu nedenle üstel dağılımın güvenilirlik ve hayatta kalma teorisinde çeşitli uygulamaları vardır.

Daha fazlasını öğrenin: Üstel dağılım

Beta Dağılımı

Beta dağılımı, (0,1) aralığında tanımlanan ve iki pozitif parametreyle parametrelendirilen bir olasılık dağılımıdır: α ve β. Yani beta dağılımının değerleri α ve β parametrelerine bağlıdır.

Bu nedenle değeri 0 ile 1 arasında olan sürekli rastgele değişkenleri tanımlamak için beta dağılımı kullanılır.

Sürekli bir rastgele değişkenin beta dağılımı tarafından yönetildiğini gösteren çeşitli gösterimler vardır, en yaygın olanları şunlardır:

\begin{array}{c}X\sim B(\alpha,\beta)\\[2ex]X\sim Beta(\alpha,\beta)\\[2ex]X\sim \beta_{\alpha,\beta}\end{array}

İstatistikte beta dağılımının çok çeşitli uygulamaları vardır. Örneğin beta dağılımı, farklı örneklerdeki yüzdelerdeki değişiklikleri incelemek için kullanılır. Benzer şekilde proje yönetiminde Pert analizini gerçekleştirmek için beta dağıtımı kullanılır.

Daha fazla bilgi edinin: Beta Dağıtımı

Gama dağılımı

Gama dağılımı, iki karakteristik parametre olan α ve λ ile tanımlanan sürekli bir olasılık dağılımıdır. Başka bir deyişle, gama dağılımı iki parametresinin değerine bağlıdır: α şekil parametresidir ve λ ölçek parametresidir.

Gama dağılımının sembolü büyük Yunan harfi Γ’dir. Yani bir rastgele değişken gama dağılımını takip ediyorsa şu şekilde yazılır:

X\sim \Gamma(\alpha,\lambda)

Gama dağılımı ayrıca şekil parametresi k = α ve ters ölçek parametresi θ = 1/λ kullanılarak parametrelendirilebilir. Her durumda gama dağılımını tanımlayan iki parametre pozitif gerçek sayılardır.

Tipik olarak gama dağılımı sağa çarpık veri setlerini modellemek için kullanılır, böylece grafiğin sol tarafında daha fazla veri konsantrasyonu olur. Örneğin, gama dağılımı elektrikli bileşenlerin güvenilirliğini modellemek için kullanılır.

Daha fazlasını öğrenin: Gama dağılımı

Weibull dağılımı

Weibull dağılımı iki karakteristik parametreyle tanımlanan sürekli bir olasılık dağılımıdır: şekil parametresi α ve ölçek parametresi λ.

İstatistiklerde Weibull dağılımı esas olarak hayatta kalma analizi için kullanılır. Aynı şekilde Weibull dağılımının da farklı alanlarda birçok uygulaması vardır.

X\sim\text{Weibull}(\alpha,\lambda)

Yazarlara göre Weibull dağılımı üç parametreyle de parametrelendirilebilir. Daha sonra dağılım grafiğinin başladığı apsisi gösteren eşik değeri adı verilen üçüncü bir parametre eklenir.

Weibull dağılımı, adını 1951 yılında onu ayrıntılı olarak açıklayan İsveçli Waloddi Weibull’dan almıştır. Ancak Weibull dağılımı 1927 yılında Maurice Fréchet tarafından keşfedilmiş ve ilk olarak 1933 yılında Rosin ve Rammler tarafından uygulanmıştır.

Daha fazlasını öğrenmek için: Weibull dağılımı

Pareto dağılımı

Pareto dağılımı, istatistikte Pareto ilkesini modellemek için kullanılan sürekli bir olasılık dağılımıdır. Dolayısıyla Pareto dağılımı, gerçekleşme olasılığı diğer değerlerden çok daha yüksek olan birkaç değere sahip bir olasılık dağılımıdır.

80-20 kuralı olarak da adlandırılan Pareto yasasının, bir olgunun nedeninin çoğunun nüfusun küçük bir kısmından kaynaklandığını söyleyen istatistiksel bir ilke olduğunu unutmayın.

Pareto dağılımının iki karakteristik parametresi vardır: ölçek parametresi x m ve şekil parametresi α.

X\sim \text{Pareto}(\alpha,x_m)

Başlangıçta Pareto dağılımı, nüfusun küçük bir kısmından kaynaklandığı için nüfus içindeki servet dağılımını tanımlamak için kullanılıyordu. Ancak şu anda Pareto dağılımının birçok uygulaması vardır; örneğin kalite kontrolde, ekonomide, bilimde, sosyal alanda vb.

Daha fazlasını öğrenin: Pareto dağılımı

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir