Distribution de probabilité
Cet article explique ce que sont les distributions de probabilité dans les statistiques. Ainsi, vous trouverez la définition de la distribution de probabilité, des exemples de distributions de probabilité et les différents types de distributions de probabilité.
Qu’est-ce qu’une distribution de probabilité ?
Une distribution de probabilité est une fonction qui définit la probabilité d’occurrence de chaque valeur d’une variable aléatoire . Autrement dit, une distribution de probabilité est une fonction mathématique qui décrit les probabilités de tous les résultats possibles d’une expérience aléatoire.
Par exemple, soit X une variable aléatoire qui indique le résultat d’un tirage au sort (« face » ou « face »), la distribution de probabilité de X vaut 0,5 pour chacun de ses résultats, puisque la probabilité d’obtenir « face » est 50 % et la probabilité d’obtenir « pile » est également de 50 %.
Par conséquent, les distributions de probabilité sont fréquemment utilisées dans la théorie des probabilités et les statistiques, car elles sont utilisées pour calculer les probabilités de différents événements dans un espace échantillon .
Types de distributions de probabilité
Les distributions de probabilité peuvent être divisées en deux grands types : les distributions discrètes et les distributions continues.
- Distribution de probabilité discrète : La distribution ne peut prendre qu’un nombre dénombrable de valeurs dans un intervalle. Normalement, les distributions de probabilité discrètes ne peuvent prendre que des valeurs entières, c’est-à-dire qu’elles n’ont pas de décimales.
- Distribution de probabilité continue : La distribution peut prendre un nombre infini de valeurs dans un intervalle. En général, les distributions de probabilité continues peuvent prendre des valeurs décimales.
Distributions de probabilité discrètes
Une distribution de probabilité discrète est la distribution qui définit les probabilités d’une variable aléatoire discrète. Par conséquent, une distribution de probabilité discrète ne peut prendre qu’un nombre fini de valeurs (généralement des valeurs entières).
Distribution uniforme discrète
La distribution uniforme discrète est une distribution de probabilité discrète dans laquelle toutes les valeurs sont équiprobables, c’est-à-dire que dans une distribution uniforme discrète, toutes les valeurs ont la même probabilité de se produire.
Par exemple, le lancer d’un dé peut être défini avec une distribution uniforme discrète, puisque tous les résultats possibles (1, 2, 3, 4, 5 ou 6) ont la même probabilité d’occurrence.
En général, une distribution uniforme discrète a deux paramètres caractéristiques, a et b , qui définissent la plage de valeurs possibles que peut prendre la distribution. Ainsi, lorsqu’une variable est définie par une distribution uniforme discrète, elle s’écrit Uniform(a,b) .
La distribution uniforme discrète peut être utilisée pour décrire des expériences aléatoires, car si tous les résultats ont la même probabilité, cela signifie que l’expérience est aléatoire.
Distribution de Bernoulli
La distribution de Bernoulli , également connue sous le nom de distribution dichotomique , est une distribution de probabilité qui représente une variable discrète qui ne peut avoir que deux résultats : « succès » ou « échec ».
Dans la distribution de Bernoulli, le « succès » est le résultat auquel nous nous attendons et a la valeur 1, tandis que le résultat de « l’échec » est un résultat autre que celui attendu et a la valeur 0. Ainsi, si la probabilité du le résultat du « succès » est p , la probabilité du résultat de « l’échec » est q=1-p .
La distribution de Bernoulli doit son nom au statisticien suisse Jacob Bernoulli.
En statistique, la distribution de Bernoulli a principalement une application : définir les probabilités d’expériences dans lesquelles il n’y a que deux résultats possibles : le succès et l’échec. Ainsi, une expérience qui utilise la distribution de Bernoulli est appelée essai de Bernoulli ou expérience de Bernoulli.
Distribution binomiale
La distribution binomiale , également appelée distribution binomiale , est une distribution de probabilité qui compte le nombre de réussites lors de la réalisation d’une série d’expériences indépendantes et dichotomiques avec une probabilité de réussite constante. Autrement dit, la distribution binomiale est une distribution qui décrit le nombre de résultats réussis d’une séquence d’essais de Bernoulli.
Par exemple, le nombre de fois où « face » apparaît lorsque l’on lance une pièce de monnaie 25 fois est une distribution binomiale.
En général, le nombre total d’expériences réalisées est défini avec le paramètre n , tandis que p est la probabilité de réussite de chaque expérience. Ainsi, une variable aléatoire qui suit une distribution binomiale s’écrit comme suit :
Notez que dans une distribution binomiale, la même expérience exacte est répétée n fois et les expériences sont indépendantes les unes des autres, donc la probabilité de succès de chaque expérience est la même (p) .
Distribution de Poisson
La distribution de Poisson est une distribution de probabilité qui définit la probabilité qu’un nombre donné d’événements se produisent sur une période de temps. Autrement dit, la distribution de Poisson sert à modéliser des variables aléatoires qui décrivent le nombre de fois qu’un phénomène se répète dans un intervalle de temps.
Par exemple, le nombre d’appels qu’un central téléphonique reçoit par minute est une variable aléatoire discrète qui peut être définie à l’aide de la distribution de Poisson.
La distribution de Poisson a un paramètre caractéristique, représenté par la lettre grecque λ et indique le nombre de fois où l’événement étudié devrait se produire au cours d’un intervalle donné.
distribution multinomiale
La distribution multinomiale (ou distribution multinomiale ) est une distribution de probabilité qui décrit la probabilité que plusieurs événements mutuellement exclusifs se produisent un nombre de fois donné après plusieurs essais.
Autrement dit, si une expérience aléatoire peut aboutir à trois événements exclusifs ou plus et que la probabilité que chaque événement se produise séparément est connue, la distribution multinomiale est utilisée pour calculer la probabilité que lorsque plusieurs expériences sont réalisées, un certain nombre d’événements se produisent. fois à chaque fois.
La distribution multinomiale est donc une généralisation de la distribution binomiale.
distribution géométrique
La distribution géométrique est une distribution de probabilité qui définit le nombre d’essais de Bernoulli nécessaire pour obtenir le premier résultat réussi. Autrement dit, une distribution géométrique modélise les processus dans lesquels les expériences de Bernoulli sont répétées jusqu’à ce que l’une d’elles obtienne un résultat positif.
Par exemple, le nombre de voitures qui passent sur une autoroute jusqu’à ce qu’elles voient une voiture jaune est une distribution géométrique.
N’oubliez pas qu’un essai Bernoulli est une expérience qui a deux résultats possibles : le « succès » et l’« échec ». Donc si la probabilité de « succès » est p , la probabilité d’« échec » est q=1-p .
La distribution géométrique dépend donc du paramètre p , qui est la probabilité de succès de toutes les expériences réalisées. De plus, la probabilité p est la même pour toutes les expériences.
distribution binomiale négative
La distribution binomiale négative est une distribution de probabilité qui décrit le nombre d’essais de Bernoulli requis pour obtenir un nombre donné de résultats positifs.
Par conséquent, une distribution binomiale négative a deux paramètres caractéristiques : r est le nombre de résultats réussis souhaités et p est la probabilité de succès pour chaque expérience de Bernoulli réalisée.
Ainsi, une distribution binomiale négative définit un processus dans lequel autant d’essais de Bernoulli sont effectués que nécessaire pour obtenir des résultats positifs. De plus, tous ces essais de Bernoulli sont indépendants et ont une probabilité de succès p constante.
Par exemple, une variable aléatoire qui suit une distribution binomiale négative est le nombre de fois qu’un dé doit être lancé jusqu’à ce que le nombre 6 soit obtenu trois fois.
distribution hypergéométrique
La distribution hypergéométrique est une distribution de probabilité qui décrit le nombre de cas réussis dans une extraction aléatoire sans remplacement de n éléments d’une population.
Autrement dit, la distribution hypergéométrique est utilisée pour calculer la probabilité d’obtenir x succès lors de l’extraction de n éléments d’une population sans en remplacer aucun.
Par conséquent, la distribution hypergéométrique a trois paramètres :
- N : est le nombre d’éléments dans la population (N = 0, 1, 2,…).
- K : est le nombre maximum de cas de réussite (K = 0, 1, 2,…,N). Puisque dans une distribution hypergéométrique un élément ne peut être considéré que comme un « succès » ou un « échec », NK est le nombre maximum de cas d’échec.
- n : est le nombre d’extractions sans remise qui sont effectuées.
Distributions de probabilité continues
Une distribution de probabilité continue est une distribution qui peut prendre n’importe quelle valeur dans un intervalle, y compris les valeurs décimales. Par conséquent, une distribution de probabilité continue définit les probabilités d’une variable aléatoire continue.
distribution uniforme et continue
La distribution uniforme continue , également appelée distribution rectangulaire , est un type de distribution de probabilité continue dans laquelle toutes les valeurs ont la même probabilité d’apparaître. Autrement dit, la distribution uniforme continue est une distribution dans laquelle la probabilité est uniformément distribuée sur un intervalle.
La distribution uniforme continue est utilisée pour décrire des variables continues qui ont une probabilité constante. De même, la distribution uniforme continue est utilisée pour définir des processus aléatoires, car si tous les résultats ont la même probabilité, cela signifie qu’il y a du hasard dans le résultat.
La distribution uniforme continue a deux paramètres caractéristiques, a et b , qui définissent l’intervalle d’équiprobabilité. Ainsi, le symbole de la distribution uniforme continue est U(a,b) , où a et b sont les valeurs caractéristiques de la distribution.
Par exemple, si le résultat d’une expérience aléatoire peut prendre n’importe quelle valeur comprise entre 5 et 9 et que tous les résultats possibles ont la même probabilité de se produire, l’expérience peut être simulée avec une distribution uniforme continue U(5,9).
Distribution normale
La distribution normale est une distribution de probabilité continue dont le graphique est en forme de cloche et symétrique par rapport à sa moyenne. En statistique, la distribution normale est utilisée pour modéliser des phénomènes aux caractéristiques très différentes, c’est pourquoi cette distribution est si importante.
En fait, en statistique, la distribution normale est considérée de loin comme la distribution la plus importante de toutes les distributions de probabilité, car elle permet non seulement de modéliser un grand nombre de phénomènes réels, mais la distribution normale peut également être utilisée pour approximer d’autres types de distributions. sous certaines conditions.
Le symbole de la distribution normale est la lettre majuscule N. Ainsi, pour indiquer qu’une variable suit une distribution normale, elle est indiquée par la lettre N et les valeurs de sa moyenne arithmétique et de son écart type sont ajoutées entre parenthèses.
La distribution normale porte de nombreux noms différents, notamment distribution gaussienne , distribution gaussienne et distribution de Laplace-Gauss .
Distribution lognormale
La distribution lognormale , ou distribution lognormale , est une distribution de probabilité qui définit une variable aléatoire dont le logarithme suit une distribution normale.
Par conséquent, si la variable X a une distribution normale, alors la fonction exponentielle e x a une distribution lognormale.
Notez que la distribution lognormale ne peut être utilisée que lorsque les valeurs de la variable sont positives, puisque le logarithme est une fonction qui n’accepte qu’un seul argument positif.
Parmi les différentes applications de la distribution lognormale, en statistique, on distingue l’utilisation de cette distribution pour analyser les investissements financiers et réaliser des analyses de fiabilité.
La distribution lognormale est également connue sous le nom de distribution Tinaut , parfois également écrite sous le nom de distribution lognormale ou de distribution log-normale .
Distribution du chi carré
La distribution du Chi carré est une distribution de probabilité dont le symbole est χ². Plus précisément, la distribution du Chi carré est la somme du carré de k variables aléatoires indépendantes avec une distribution normale.
Ainsi, la distribution du Chi carré a k degrés de liberté. Par conséquent, une distribution du Chi carré a autant de degrés de liberté que la somme des carrés des variables normalement distribuées qu’elle représente.
La distribution du Chi carré est également connue sous le nom de distribution de Pearson .
La distribution du chi carré est largement utilisée dans l’inférence statistique, par exemple dans les tests d’hypothèses et les intervalles de confiance. Nous verrons ci-dessous quelles sont les applications de ce type de distribution de probabilité.
Distribution t de Student
La distribution t de Student est une distribution de probabilité largement utilisée en statistique. Plus précisément, la distribution t de Student est utilisée dans le test t de Student pour déterminer la différence entre les moyennes de deux échantillons et pour établir des intervalles de confiance.
La distribution t de Student a été développée par le statisticien William Sealy Gosset en 1908 sous le pseudonyme de « Student ».
La distribution t de Student est définie par son nombre de degrés de liberté, obtenu en soustrayant une unité du nombre total d’observations. Par conséquent, la formule pour déterminer les degrés de liberté d’une distribution t de Student est ν=n-1 .
Snedecor F Distribution
La distribution F de Snedecor , également appelée distribution F de Fisher-Snedecor ou simplement distribution F , est une distribution de probabilité continue utilisée dans l’inférence statistique, en particulier dans l’analyse de la variance.
L’une des propriétés de la distribution Snedecor F est qu’elle est définie par la valeur de deux paramètres réels, m et n , qui indiquent ses degrés de liberté. Ainsi, le symbole de la distribution Snedecor F est F m,n , où m et n sont les paramètres qui définissent la distribution.
Mathématiquement, la distribution Snedecor F est égale au quotient entre une distribution du chi carré et ses degrés de liberté divisé par le quotient entre une autre distribution du chi carré et ses degrés de liberté. Ainsi, la formule qui définit la distribution Snedecor F est la suivante :
La distribution Fisher-Snedecor F doit son nom au statisticien anglais Ronald Fisher et au statisticien américain George Snedecor.
En statistique, la distribution Fisher-Snedecor F a différentes applications. Par exemple, la distribution F de Fisher-Snedecor est utilisée pour comparer différents modèles de régression linéaire, et cette distribution de probabilité est utilisée dans l’analyse de variance (ANOVA).
distribution exponentielle
La distribution exponentielle est une distribution de probabilité continue utilisée pour modéliser le temps d’attente pour l’apparition d’un phénomène aléatoire.
Plus précisément, la distribution exponentielle permet de décrire le temps d’attente entre deux phénomènes qui suivent une distribution de Poisson. Par conséquent, la distribution exponentielle est étroitement liée à la distribution de Poisson.
La distribution exponentielle a un paramètre caractéristique, représenté par la lettre grecque λ et indique le nombre de fois que l’événement étudié est censé se produire au cours d’une période de temps donnée.
De même, la distribution exponentielle est également utilisée pour modéliser le temps jusqu’à ce qu’une panne se produise. La distribution exponentielle a donc plusieurs applications en théorie de la fiabilité et de la survie.
Distribution bêta
La distribution bêta est une distribution de probabilité définie dans l’intervalle (0,1) et paramétrée par deux paramètres positifs : α et β. Autrement dit, les valeurs de la distribution bêta dépendent des paramètres α et β.
Par conséquent, la distribution bêta sert à définir des variables aléatoires continues dont la valeur est comprise entre 0 et 1.
Il existe plusieurs notations pour indiquer qu’une variable aléatoire continue est régie par une distribution bêta, les plus courantes sont :
En statistiques, la distribution bêta a des applications très variées. Par exemple, la distribution bêta est utilisée pour étudier les variations de pourcentages dans différents échantillons. De même, en gestion de projet, la distribution bêta est utilisée pour réaliser une analyse Pert.
Distribution gamma
La distribution gamma est une distribution de probabilité continue définie par deux paramètres caractéristiques, α et λ. Autrement dit, la distribution gamma dépend de la valeur de ses deux paramètres : α est le paramètre de forme et λ est le paramètre d’échelle.
Le symbole de la distribution gamma est la lettre grecque majuscule Γ. Ainsi, si une variable aléatoire suit une distribution gamma, elle s’écrit comme suit :
La distribution gamma peut également être paramétrée à l’aide du paramètre de forme k = α et du paramètre d’échelle inverse θ = 1/λ. Dans tous les cas, les deux paramètres qui définissent la distribution gamma sont des nombres réels positifs.
En général, la distribution gamma est utilisée pour modéliser des ensembles de données asymétriques vers la droite, de sorte qu’il y ait une plus grande concentration de données sur le côté gauche du tracé. Par exemple, la distribution gamma est utilisée pour modéliser la fiabilité des composants électriques.
Distribution de Weibull
La distribution de Weibull est une distribution de probabilité continue définie par deux paramètres caractéristiques : le paramètre de forme α et le paramètre d’échelle λ.
En statistiques, la distribution de Weibull est principalement utilisée pour l’analyse de survie. De même, la distribution Weibull a de nombreuses applications dans différents domaines.
Selon les auteurs, la distribution de Weibull peut également être paramétrée avec trois paramètres. Ensuite, un troisième paramètre appelé valeur seuil est ajouté, qui indique l’abscisse à laquelle commence le graphe de distribution.
La distribution de Weibull doit son nom au Suédois Waloddi Weibull, qui l’a décrite en détail en 1951. Cependant, la distribution de Weibull a été découverte par Maurice Fréchet en 1927 et appliquée pour la première fois par Rosin et Rammler en 1933.
Distribution de Pareto
La distribution de Pareto est une distribution de probabilité continue utilisée en statistique pour modéliser le principe de Pareto. Par conséquent, la distribution de Pareto est une distribution de probabilité qui a quelques valeurs dont la probabilité d’occurrence est bien supérieure au reste des valeurs.
Rappelons que la loi de Pareto, également appelée règle des 80-20, est un principe statistique qui dit que l’essentiel de la cause d’un phénomène est dû à une petite partie de la population.
La distribution de Pareto a deux paramètres caractéristiques : le paramètre d’échelle x m et le paramètre de forme α.
À l’origine, la distribution de Pareto était utilisée pour décrire la répartition de la richesse au sein de la population, car la majeure partie de celle-ci était due à une petite proportion de la population. Mais actuellement, la distribution de Pareto a de nombreuses applications, par exemple dans le contrôle qualité, en économie, en science, dans le domaine social, etc.