Distribution de probabilité continue
Cet article explique ce que sont les distributions de probabilité continues et à quoi elles servent dans les statistiques. Vous découvrirez donc ce que signifie qu’une distribution de probabilité soit continue, des exemples de distributions continues et quels sont les différents types de distributions continues.
Qu’est-ce qu’une distribution de probabilité continue ?
Une distribution de probabilité continue est une distribution dont la fonction de distribution est continue. Par conséquent, une distribution de probabilité continue définit les probabilités d’une variable aléatoire continue .
Par exemple, la distribution normale et la distribution t de Student sont des distributions de probabilité continues.
L’une des caractéristiques des distributions de probabilité continues est qu’elles peuvent prendre n’importe quelle valeur dans un intervalle. Ainsi, contrairement aux distributions de probabilité discrètes, les distributions de probabilité continues peuvent prendre des valeurs décimales.
Dans les distributions continues, pour calculer une probabilité cumulée, il faut trouver l’aire sous la courbe de la distribution, donc dans ce type de distributions de probabilité, la fonction de probabilité cumulée est équivalente à l’intégrale de la fonction de densité .
Exemples de distributions de probabilité continue
Une fois que nous aurons vu la définition de la distribution de probabilité continue, nous allons voir plusieurs exemples de ce type de distribution pour mieux comprendre le concept.
Exemples de distributions de probabilité continues :
- Le poids des étudiants dans un cours.
- La durée de vie d’un composant électrique.
- La rentabilité des actions des sociétés cotées en bourse.
- La vitesse d’une voiture.
- Le prix de certaines actions.
Types de distributions de probabilité continues
Les principaux types de distributions de probabilité continues sont les suivants :
- Distribution uniforme et continue
- Distribution normale
- Distribution lognormale
- Distribution du chi carré
- Distribution t de Student
- Snedecor F Distribution
- Distribution exponentielle
- Distribution bêta
- Distribution gamma
- Distribution de Weibull
- Distribution de Pareto
Chaque type de distribution de probabilité continue est expliqué en détail ci-dessous.
Distribution uniforme et continue
La distribution uniforme continue , également appelée distribution rectangulaire , est un type de distribution de probabilité continue dans laquelle toutes les valeurs ont la même probabilité d’apparaître. Autrement dit, la distribution uniforme continue est une distribution dans laquelle la probabilité est uniformément distribuée sur un intervalle.
La distribution uniforme continue est utilisée pour décrire des variables continues qui ont une probabilité constante. De même, la distribution uniforme continue est utilisée pour définir des processus aléatoires, car si tous les résultats ont la même probabilité, cela signifie qu’il y a du hasard dans le résultat.
La distribution uniforme continue a deux paramètres caractéristiques, a et b , qui définissent l’intervalle d’équiprobabilité. Ainsi, le symbole de la distribution uniforme continue est U(a,b) , où a et b sont les valeurs caractéristiques de la distribution.
Par exemple, si le résultat d’une expérience aléatoire peut prendre n’importe quelle valeur comprise entre 5 et 9 et que tous les résultats possibles ont la même probabilité de se produire, l’expérience peut être simulée avec une distribution uniforme continue U(5,9).
Distribution normale
La distribution normale est une distribution de probabilité continue dont le graphique est en forme de cloche et symétrique par rapport à sa moyenne. En statistique, la distribution normale est utilisée pour modéliser des phénomènes aux caractéristiques très différentes, c’est pourquoi cette distribution est si importante.
En fait, en statistique, la distribution normale est considérée de loin comme la distribution la plus importante de toutes les distributions de probabilité, car elle permet non seulement de modéliser un grand nombre de phénomènes réels, mais la distribution normale peut également être utilisée pour approximer d’autres types de distributions. sous certaines conditions.
Le symbole de la distribution normale est la lettre majuscule N. Ainsi, pour indiquer qu’une variable suit une distribution normale, elle est indiquée par la lettre N et les valeurs de sa moyenne arithmétique et de son écart type sont ajoutées entre parenthèses.
La distribution normale porte de nombreux noms différents, notamment distribution gaussienne , distribution gaussienne et distribution de Laplace-Gauss .
Distribution lognormale
La distribution lognormale , ou distribution lognormale , est une distribution de probabilité qui définit une variable aléatoire dont le logarithme suit une distribution normale.
Par conséquent, si la variable X a une distribution normale, alors la fonction exponentielle e x a une distribution lognormale.
Notez que la distribution lognormale ne peut être utilisée que lorsque les valeurs de la variable sont positives, puisque le logarithme est une fonction qui n’accepte qu’un seul argument positif.
Parmi les différentes applications de la distribution lognormale, en statistique, on distingue l’utilisation de cette distribution pour analyser les investissements financiers et réaliser des analyses de fiabilité.
La distribution lognormale est également connue sous le nom de distribution Tinaut , parfois également écrite sous le nom de distribution lognormale ou de distribution log-normale .
Distribution du chi carré
La distribution du Chi carré est une distribution de probabilité dont le symbole est χ². Plus précisément, la distribution du Chi carré est la somme du carré de k variables aléatoires indépendantes avec une distribution normale.
Ainsi, la distribution du Chi carré a k degrés de liberté. Par conséquent, une distribution du Chi carré a autant de degrés de liberté que la somme des carrés des variables normalement distribuées qu’elle représente.
La distribution du Chi carré est également connue sous le nom de distribution de Pearson .
La distribution du chi carré est largement utilisée dans l’inférence statistique, par exemple dans les tests d’hypothèses et les intervalles de confiance. Nous verrons ci-dessous quelles sont les applications de ce type de distribution de probabilité.
Distribution t de Student
La distribution t de Student est une distribution de probabilité largement utilisée en statistique. Plus précisément, la distribution t de Student est utilisée dans le test t de Student pour déterminer la différence entre les moyennes de deux échantillons et pour établir des intervalles de confiance.
La distribution t de Student a été développée par le statisticien William Sealy Gosset en 1908 sous le pseudonyme de « Student ».
La distribution t de Student est définie par son nombre de degrés de liberté, obtenu en soustrayant une unité du nombre total d’observations. Par conséquent, la formule pour déterminer les degrés de liberté d’une distribution t de Student est ν=n-1 .
Snedecor F Distribution
La distribution F de Snedecor , également appelée distribution F de Fisher – Snedecor ou simplement distribution F , est une distribution de probabilité continue utilisée dans l’inférence statistique, en particulier dans l’analyse de la variance.
L’une des propriétés de la distribution Snedecor F est qu’elle est définie par la valeur de deux paramètres réels, m et n , qui indiquent leurs degrés de liberté. Ainsi, le symbole de la distribution Snedecor F est F m,n , où m et n sont les paramètres qui définissent la distribution.
Mathématiquement, la distribution Snedecor F est égale au quotient entre une distribution du chi carré et ses degrés de liberté divisé par le quotient entre une autre distribution du chi carré et ses degrés de liberté. Ainsi, la formule qui définit la distribution Snedecor F est la suivante :
La distribution Fisher-Snedecor F doit son nom au statisticien anglais Ronald Fisher et au statisticien américain George Snedecor.
En statistique, la distribution Fisher-Snedecor F a différentes applications. Par exemple, la distribution F de Fisher-Snedecor est utilisée pour comparer différents modèles de régression linéaire, et cette distribution de probabilité est utilisée dans l’analyse de variance (ANOVA).
Distribution exponentielle
La distribution exponentielle est une distribution de probabilité continue utilisée pour modéliser le temps d’attente pour l’apparition d’un phénomène aléatoire.
Plus précisément, la distribution exponentielle permet de décrire le temps d’attente entre deux phénomènes qui suivent une distribution de Poisson. Par conséquent, la distribution exponentielle est étroitement liée à la distribution de Poisson.
La distribution exponentielle a un paramètre caractéristique, représenté par la lettre grecque λ et indique le nombre de fois que l’événement étudié est censé se produire au cours d’une période de temps donnée.
De même, la distribution exponentielle est également utilisée pour modéliser le temps jusqu’à ce qu’une panne se produise. La distribution exponentielle a donc plusieurs applications en théorie de la fiabilité et de la survie.
Distribution bêta
La distribution bêta est une distribution de probabilité définie sur l’intervalle (0,1) et paramétrée par deux paramètres positifs : α et β. Autrement dit, les valeurs de la distribution bêta dépendent des paramètres α et β.
Par conséquent, la distribution bêta sert à définir des variables aléatoires continues dont la valeur est comprise entre 0 et 1.
Il existe plusieurs notations pour indiquer qu’une variable aléatoire continue est régie par une distribution bêta, les plus courantes sont :
En statistiques, la distribution bêta a des applications très variées. Par exemple, la distribution bêta est utilisée pour étudier les variations de pourcentages dans différents échantillons. De même, en gestion de projet, la distribution bêta est utilisée pour réaliser une analyse Pert.
Distribution gamma
La distribution gamma est une distribution de probabilité continue définie par deux paramètres caractéristiques, α et λ. Autrement dit, la distribution gamma dépend de la valeur de ses deux paramètres : α est le paramètre de forme et λ est le paramètre d’échelle.
Le symbole de la distribution gamma est la lettre grecque majuscule Γ. Ainsi, si une variable aléatoire suit une distribution gamma, elle s’écrit comme suit :
La distribution gamma peut également être paramétrée à l’aide du paramètre de forme k = α et du paramètre d’échelle inverse θ = 1/λ. Dans tous les cas, les deux paramètres qui définissent la distribution gamma sont des nombres réels positifs.
En général, la distribution gamma est utilisée pour modéliser des ensembles de données asymétriques vers la droite, de sorte qu’il y ait une plus grande concentration de données sur le côté gauche du graphique. Par exemple, la distribution gamma est utilisée pour modéliser la fiabilité des composants électriques.
Distribution de Weibull
La distribution de Weibull est une distribution de probabilité continue définie par deux paramètres caractéristiques : le paramètre de forme α et le paramètre d’échelle λ.
En statistiques, la distribution de Weibull est principalement utilisée pour l’analyse de survie. De même, la distribution Weibull a de nombreuses applications dans différents domaines.
Selon les auteurs, la distribution de Weibull peut également être paramétrée avec trois paramètres. Ensuite, un troisième paramètre appelé valeur seuil est ajouté, qui indique l’abscisse à laquelle commence le graphe de distribution.
La distribution de Weibull doit son nom au Suédois Waloddi Weibull, qui l’a décrite en détail en 1951. Cependant, la distribution de Weibull a été découverte par Maurice Fréchet en 1927 et appliquée pour la première fois par Rosin et Rammler en 1933.
Distribution de Pareto
La distribution de Pareto est une distribution de probabilité continue utilisée en statistique pour modéliser le principe de Pareto. Par conséquent, la distribution de Pareto est une distribution de probabilité qui a quelques valeurs dont la probabilité d’occurrence est bien supérieure au reste des valeurs.
Rappelons que la loi de Pareto, également appelée règle des 80-20, est un principe statistique qui dit que l’essentiel de la cause d’un phénomène est dû à une petite partie de la population.
La distribution de Pareto a deux paramètres caractéristiques : le paramètre d’échelle x m et le paramètre de forme α.
À l’origine, la distribution de Pareto était utilisée pour décrire la répartition de la richesse au sein de la population, car la majeure partie de celle-ci était due à une petite proportion de la population. Mais actuellement, la distribution de Pareto a de nombreuses applications, par exemple dans le contrôle qualité, en économie, en science, dans le domaine social, etc.
Distribution de probabilité continue et discrète
Les distributions de probabilité peuvent être classées en distributions continues et distributions discrètes. Donc, pour finir, nous verrons quelle est la différence entre ces deux types de distributions de probabilité.
La différence entre les distributions de probabilité continues et les distributions de probabilité discrètes réside dans le nombre de valeurs qu’elles peuvent prendre. Les distributions continues peuvent prendre un nombre infini de valeurs dans un intervalle, tandis que les distributions discrètes ne peuvent prendre qu’un nombre dénombrable de valeurs dans un intervalle.
Par conséquent, en général, une façon de différencier les distributions continues des distributions discrètes consiste à utiliser le type de nombres qu’elles peuvent prendre. Normalement, une distribution continue peut prendre n’importe quelle valeur, y compris des nombres décimaux, tandis que les distributions discrètes ne peuvent prendre que des nombres entiers.