Continue waarschijnlijkheidsverdeling

In dit artikel wordt uitgelegd wat continue kansverdelingen zijn en waarvoor ze in de statistieken worden gebruikt. Zo ontdek je wat het betekent dat een kansverdeling continu is, voorbeelden van continue verdelingen en wat de verschillende soorten continue verdelingen zijn.

Wat is een continue kansverdeling?

Een continue kansverdeling is een kansverdeling waarvan de verdelingsfunctie continu is. Daarom definieert een continue kansverdeling de kansen van een continue willekeurige variabele .

De normale verdeling en de Student’s t-verdeling zijn bijvoorbeeld continue kansverdelingen.

Een van de kenmerken van continue kansverdelingen is dat ze elke waarde binnen een interval kunnen aannemen. In tegenstelling tot discrete kansverdelingen kunnen continue kansverdelingen dus decimale waarden aannemen.

Om bij continue verdelingen een cumulatieve waarschijnlijkheid te berekenen, moet men het gebied onder de curve van de verdeling vinden, dus bij dit type kansverdelingen is de cumulatieve waarschijnlijkheidsfunctie equivalent aan de integraal van de dichtheidsfunctie .

\displaystyle P[X\leq x]=\int_{-\infty}^x f(x)dx

Voorbeelden van continue waarschijnlijkheidsverdelingen

Zodra we de definitie van continue kansverdeling hebben gezien, zullen we verschillende voorbeelden van dit type verdeling zien om het concept beter te begrijpen.

Voorbeelden van continue kansverdelingen:

  1. Het gewicht van studenten in een cursus.
  2. De levensduur van een elektrisch onderdeel.
  3. De winstgevendheid van aandelen van beursgenoteerde bedrijven.
  4. De snelheid van een auto.
  5. De prijs van bepaalde aandelen.

Soorten continue kansverdelingen

De belangrijkste soorten continue kansverdelingen zijn:

  • Uniforme en continue distributie
  • Normale verdeling
  • Lognormale verdeling
  • Chi-kwadraatverdeling
  • Student’s t-verdeling
  • Snedecor F-distributie
  • Exponentiële verdeling
  • Bètadistributie
  • Gamma-distributie
  • Weibull-distributie
  • Pareto-distributie

Elk type continue kansverdeling wordt hieronder in detail uitgelegd.

Uniforme en continue distributie

De continue uniforme verdeling , ook wel de rechthoekige verdeling genoemd, is een soort continue kansverdeling waarbij alle waarden dezelfde kans hebben om te verschijnen. Met andere woorden: de continue uniforme verdeling is een verdeling waarbij de waarschijnlijkheid uniform verdeeld is over een interval.

De continue uniforme verdeling wordt gebruikt om continue variabelen te beschrijven die een constante waarschijnlijkheid hebben. Op dezelfde manier wordt continue uniforme verdeling gebruikt om willekeurige processen te definiëren, omdat als alle uitkomsten dezelfde waarschijnlijkheid hebben, dit betekent dat er willekeur in de uitkomst zit.

De continue uniforme verdeling heeft twee karakteristieke parameters, a en b , die het equiprobabiliteitsinterval definiëren. Het symbool voor de continue uniforme verdeling is dus U(a,b) , waarbij a en b de karakteristieke waarden van de verdeling zijn.

X\sim U(a,b)

Als de uitkomst van een willekeurig experiment bijvoorbeeld elke waarde tussen 5 en 9 kan aannemen en alle mogelijke uitkomsten dezelfde waarschijnlijkheid hebben om te voorkomen, kan het experiment worden gesimuleerd met een continue uniforme verdeling U(5.9).

Normale verdeling

De normale verdeling is een continue kansverdeling waarvan de grafiek klokvormig is en symmetrisch ten opzichte van het gemiddelde. In de statistiek wordt de normale verdeling gebruikt om verschijnselen met zeer verschillende kenmerken te modelleren. Daarom is deze verdeling zo belangrijk.

In feite wordt de normale verdeling in de statistiek beschouwd als verreweg de belangrijkste verdeling van alle waarschijnlijkheidsverdelingen, omdat deze niet alleen een groot aantal verschijnselen uit de echte wereld kan modelleren, maar de normale verdeling ook kan worden gebruikt om andere typen kansverdelingen te benaderen. distributies. onder bepaalde omstandigheden.

Het symbool voor normale verdeling is de hoofdletter N. Om aan te geven dat een variabele een normale verdeling volgt, wordt deze aangegeven met de letter N en worden de waarden van het rekenkundig gemiddelde en de standaarddeviatie tussen haakjes toegevoegd.

X\sim N(\mu,\sigma)

De normale verdeling heeft veel verschillende namen, waaronder Gaussische verdeling , Gaussische verdeling en Laplace-Gauss-verdeling .

Lognormale verdeling

De lognormale verdeling , of lognormale verdeling , is een kansverdeling die een willekeurige variabele definieert waarvan de logaritme een normale verdeling volgt.

Als de variabele X dus een normale verdeling heeft, heeft de exponentiële functie ex x een lognormale verdeling.

X\sim \text{Lognormal}(\mu,\sigma^2)

Merk op dat de lognormale verdeling alleen kan worden gebruikt als de waarden van de variabele positief zijn, aangezien de logaritme een functie is die slechts één positief argument accepteert.

Onder de verschillende toepassingen van de lognormale verdeling in de statistiek onderscheiden we het gebruik van deze verdeling om financiële investeringen te analyseren en betrouwbaarheidsanalyses uit te voeren.

De lognormale verdeling is ook bekend als de Tinaut-verdeling , soms ook geschreven als de lognormale verdeling of log-normale verdeling .

Chi-kwadraatverdeling

De Chi-kwadraatverdeling is een kansverdeling waarvan het symbool χ² is. Preciezer gezegd: de Chi-kwadraatverdeling is de som van het kwadraat van k onafhankelijke willekeurige variabelen met een normale verdeling.

De Chi-kwadraatverdeling heeft dus k vrijheidsgraden. Daarom heeft een Chi-kwadraatverdeling evenveel vrijheidsgraden als de som van de kwadraten van de normaal verdeelde variabelen die deze vertegenwoordigt.

\displaystyle X\sim\chi^2_k \ \color{orange}\bm{\longrightarrow}\color{black}\ \begin{array}{l}\text{Distribuci\'on chi-cuadrado}\\[2ex]\text{con k grados de libertad}\end{array}

De Chi-kwadraatverdeling wordt ook wel de Pearson-verdeling genoemd.

De chikwadraatverdeling wordt veel gebruikt bij statistische gevolgtrekkingen, bijvoorbeeld bij het testen van hypothesen en betrouwbaarheidsintervallen. We zullen hieronder zien wat de toepassingen zijn van dit type kansverdeling.

Student’s t-verdeling

De Student’s t-verdeling is een kansverdeling die veel wordt gebruikt in de statistiek. Concreet wordt de Student’s t-verdeling gebruikt in de Student’s t-test om het verschil tussen de gemiddelden van twee steekproeven te bepalen en om betrouwbaarheidsintervallen vast te stellen.

De Student’s t-verdeling werd in 1908 ontwikkeld door statisticus William Sealy Gosset onder het pseudoniem „Student“.

De t-verdeling van de Student wordt gedefinieerd door het aantal vrijheidsgraden, verkregen door één eenheid af te trekken van het totale aantal waarnemingen. Daarom is de formule voor het bepalen van de vrijheidsgraden van een Student’s t-verdeling v=n-1 .

\begin{array}{c}\nu=n-1\\[2ex]X\sim t_\nu\end{array}

Snedecor F-distributie

De Snedecor F-verdeling , ook wel de Fisher-Snedecor F-verdeling of eenvoudigweg F-verdeling genoemd, is een continue kansverdeling die wordt gebruikt bij statistische gevolgtrekkingen, vooral bij variantieanalyse.

Een van de eigenschappen van de Snedecor F-verdeling is dat deze wordt gedefinieerd door de waarde van twee reële parameters, m en n , die hun vrijheidsgraden aangeven. Het symbool voor de Snedecor-verdeling F is dus Fm ,n , waarbij m en n de parameters zijn die de verdeling definiëren.

F_{m,n}\qquad m,n>0″ title=“Rendered by QuickLaTeX.com“ height=“18″ width=“139″ style=“vertical-align: -6px;“></p>
</p>
<p> Wiskundig gezien is de Snedecor F-verdeling gelijk aan het quotiënt tussen een chikwadraatverdeling en zijn vrijheidsgraden gedeeld door het quotiënt tussen een andere chikwadraatverdeling en zijn vrijheidsgraden. De formule die de Snedecor F-verdeling definieert, is dus als volgt:</p>
</p>
<p class=\left.\begin{array}{c} X\sim \chi_m^2\\[2ex] Y\sim \chi_n^2\end{array}\right\}\color{orange}\bm{\longrightarrow}\color{black}\ F_{m,n}= \cfrac{X/m}{Y/n}

De Fisher-Snedecor F-verdeling dankt zijn naam aan de Engelse statisticus Ronald Fisher en de Amerikaanse statisticus George Snedecor.

In de statistieken heeft de Fisher-Snedecor F-verdeling verschillende toepassingen. De Fisher-Snedecor F-verdeling wordt bijvoorbeeld gebruikt om verschillende lineaire regressiemodellen te vergelijken, en deze waarschijnlijkheidsverdeling wordt gebruikt bij variantieanalyse (ANOVA).

Exponentiële verdeling

De exponentiële verdeling is een continue kansverdeling die wordt gebruikt om de wachttijd voor het optreden van een willekeurig fenomeen te modelleren.

Nauwkeuriger gezegd maakt de exponentiële verdeling het mogelijk om de wachttijd tussen twee verschijnselen te beschrijven die een Poisson-verdeling volgt. Daarom is de exponentiële verdeling nauw verwant aan de Poisson-verdeling.

De exponentiële verdeling heeft een karakteristieke parameter, weergegeven door de Griekse letter λ, en geeft aan hoe vaak de bestudeerde gebeurtenis naar verwachting zal plaatsvinden gedurende een bepaalde tijdsperiode.

X\sim \text{Exp}(\lambda)

Op dezelfde manier wordt de exponentiële verdeling ook gebruikt om de tijd te modelleren totdat er een storing optreedt. De exponentiële verdeling heeft daarom verschillende toepassingen in de betrouwbaarheids- en overlevingstheorie.

Bètadistributie

De bètaverdeling is een waarschijnlijkheidsverdeling gedefinieerd op het interval (0,1) en geparametriseerd door twee positieve parameters: α en β. Met andere woorden: de waarden van de bètaverdeling zijn afhankelijk van de parameters α en β.

Daarom wordt de bètaverdeling gebruikt om continue willekeurige variabelen te definiëren waarvan de waarde tussen 0 en 1 ligt.

Er zijn verschillende notaties die aangeven dat een continue willekeurige variabele wordt bepaald door een bètaverdeling. De meest voorkomende zijn:

\begin{array}{c}X\sim B(\alpha,\beta)\\[2ex]X\sim Beta(\alpha,\beta)\\[2ex]X\sim \beta_{\alpha,\beta}\end{array}

In de statistieken heeft de bètadistributie zeer uiteenlopende toepassingen. De bètaverdeling wordt bijvoorbeeld gebruikt om variaties in percentages in verschillende steekproeven te bestuderen. Op dezelfde manier wordt bij projectbeheer bètadistributie gebruikt om Pert-analyse uit te voeren.

Gamma-distributie

De gammaverdeling is een continue waarschijnlijkheidsverdeling die wordt gedefinieerd door twee karakteristieke parameters, α en λ. Met andere woorden, de gammaverdeling hangt af van de waarde van de twee parameters: α is de vormparameter en λ is de schaalparameter.

Het symbool voor de gammaverdeling is de Griekse hoofdletter Γ. Dus als een willekeurige variabele een gammaverdeling volgt, wordt deze als volgt geschreven:

X\sim \Gamma(\alpha,\lambda)

De gammaverdeling kan ook worden geparametriseerd met behulp van de vormparameter k = α en de inverse schaalparameter θ = 1/λ. In alle gevallen zijn de twee parameters die de gammaverdeling bepalen positieve reële getallen.

Meestal wordt de gammaverdeling gebruikt om naar rechts scheve gegevenssets te modelleren, zodat er een grotere concentratie van gegevens aan de linkerkant van de grafiek is. De gammaverdeling wordt bijvoorbeeld gebruikt om de betrouwbaarheid van elektrische componenten te modelleren.

Weibull-distributie

De Weibull-verdeling is een continue waarschijnlijkheidsverdeling die wordt gedefinieerd door twee karakteristieke parameters: de vormparameter α en de schaalparameter λ.

In de statistieken wordt de Weibull-verdeling voornamelijk gebruikt voor overlevingsanalyse. Op dezelfde manier heeft de Weibull-distributie veel toepassingen op verschillende gebieden.

X\sim\text{Weibull}(\alpha,\lambda)

Volgens de auteurs kan de Weibull-verdeling ook worden geparametriseerd met drie parameters. Vervolgens wordt een derde parameter, drempelwaarde genaamd, toegevoegd, die de abscis aangeeft waarop de verdelingsgrafiek begint.

De Weibull-verdeling is vernoemd naar de Zweed Waloddi Weibull, die deze in 1951 gedetailleerd beschreef. De Weibull-verdeling werd echter in 1927 ontdekt door Maurice Fréchet en voor het eerst toegepast door Rosin en Rammler in 1933.

Pareto-distributie

De Pareto-verdeling is een continue kansverdeling die in statistieken wordt gebruikt om het Pareto-principe te modelleren. Daarom is de Pareto-verdeling een kansverdeling die een paar waarden heeft waarvan de waarschijnlijkheid van voorkomen veel groter is dan de rest van de waarden.

Bedenk dat de wet van Pareto, ook wel de 80-20-regel genoemd, een statistisch principe is dat zegt dat het grootste deel van de oorzaak van een fenomeen te wijten is aan een klein deel van de bevolking.

De Pareto-verdeling heeft twee karakteristieke parameters: de schaalparameter x m en de vormparameter α.

X\sim \text{Pareto}(\alpha,x_m)

Oorspronkelijk werd de Pareto-verdeling gebruikt om de verdeling van de rijkdom binnen de bevolking te beschrijven, omdat het grootste deel ervan te danken was aan een klein deel van de bevolking. Maar momenteel heeft de Pareto-verdeling vele toepassingen, bijvoorbeeld in de kwaliteitscontrole, in de economie, in de wetenschap, op sociaal gebied, enz.

Continue en discrete kansverdeling

Kansverdelingen kunnen worden ingedeeld in continue verdelingen en discrete verdelingen. Ten slotte zullen we zien wat het verschil is tussen deze twee soorten kansverdelingen.

Het verschil tussen continue kansverdelingen en discrete kansverdelingen is het aantal waarden dat ze kunnen aannemen. Continue distributies kunnen een oneindig aantal waarden in een interval aannemen, terwijl discrete distributies slechts een telbaar aantal waarden in een interval kunnen aannemen.

Daarom is een manier om continue distributies te onderscheiden van discrete distributies over het algemeen het soort getallen dat ze kunnen aannemen. Normaal gesproken kan een continue verdeling elke waarde aannemen, inclusief decimale getallen, terwijl discrete verdelingen alleen gehele getallen kunnen aannemen.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert