CDF ou PDF : quelle est la différence ?



Ce didacticiel fournit une explication simple de la différence entre un PDF (fonction de densité de probabilité) et un CDF (fonction de distribution cumulative) en statistiques.

Variables aléatoires

Avant de pouvoir définir un PDF ou un CDF, nous devons d’abord comprendre les variables aléatoires.

Une variable aléatoire , généralement notée X, est une variable dont les valeurs sont les résultats numériques d’un processus aléatoire. Il existe deux types de variables aléatoires : discrètes et continues.

Variables aléatoires discrètes

Une variable aléatoire discrète est une variable qui ne peut prendre qu’un nombre dénombrable de valeurs distinctes comme 0, 1, 2, 3, 4, 5… 100, 1 million, etc. Voici quelques exemples de variables aléatoires discrètes :

  • Le nombre de fois qu’une pièce tombe sur pile après avoir été lancée 20 fois.
  • Le nombre de fois qu’un dé atterrit sur le chiffre 4 après avoir été lancé 100 fois.

Variables aléatoires continues

Une variable aléatoire continue est une variable qui peut prendre un nombre infini de valeurs possibles. Voici quelques exemples de variables aléatoires continues :

  • Taille d’une personne
  • Poids d’un animal
  • Temps nécessaire pour parcourir un mile

Par exemple, la taille d’une personne peut être de 60,2 pouces, 65,2344 pouces, 70,431222 pouces, etc. Il existe une quantité infinie de valeurs possibles pour la taille.

Règle générale : si vous pouvez compter le nombre de résultats, alors vous travaillez avec une variable aléatoire discrète (par exemple, compter le nombre de fois qu’une pièce tombe sur face). Mais si vous pouvez mesurer le résultat, vous travaillez avec une variable aléatoire continue (par exemple mesure, taille, poids, temps, etc.)

Fonctions de densité de probabilité

Une fonction de densité de probabilité (pdf) nous indique la probabilité qu’une variable aléatoire prenne une certaine valeur.

Par exemple, supposons que nous lançons un dé une fois. Si nous laissons x désigner le nombre sur lequel les dés atterrissent, alors la fonction de densité de probabilité pour le résultat peut être décrite comme suit :

P(x < 1) : 0

P(x = 1) : 1/6

P(x = 2) : 1/6

P(x = 3) : 1/6

P(x = 4) : 1/6

P(x = 5) : 1/6

P(x = 6) : 1/6

P(x > 6) : 0

Notez qu’il s’agit d’un exemple de variable aléatoire discrète, puisque x ne peut prendre que des valeurs entières.

Pour une variable aléatoire continue, nous ne pouvons pas utiliser directement un PDF, puisque la probabilité que x prenne une valeur exacte est nulle.

Par exemple, supposons que nous souhaitions connaître la probabilité qu’un hamburger d’un restaurant particulier pèse un quart de livre (0,25 livre). Le poids étant une variable continue, il peut prendre un nombre infini de valeurs.

Par exemple, un hamburger donné peut en réalité peser 0,250001 livre, ou 0,24 livre, ou 0,2488 livre. La probabilité qu’un hamburger donné pèse exactement 0,25 livre est essentiellement nulle.

Fonctions de distribution cumulative

Une fonction de distribution cumulative (cdf) nous indique la probabilité qu’une variable aléatoire prenne une valeur inférieure ou égale à x .

Par exemple, supposons que nous lançons un dé une fois. Si nous laissons x désigner le nombre sur lequel les dés atterrissent, alors la fonction de distribution cumulative du résultat peut être décrite comme suit :

P(x ≤ 0) : 0

P(x ≤ 1) : 1/6

P(x ≤ 2) : 2/6

P(x ≤ 3) : 3/6

P(x ≤ 4) : 4/6

P(x ≤ 5) : 5/6

P(x ≤ 6) : 6/6

P(x > 6) : 0

Notez que la probabilité que x soit inférieur ou égal à 6 est de 6/6, ce qui est égal à 1. En effet, les dés atterriront sur 1, 2, 3, 4, 5 ou 6 avec une probabilité de 100 %.

Cet exemple utilise une variable aléatoire discrète, mais une fonction de densité continue peut également être utilisée pour une variable aléatoire continue.

Les fonctions de distribution cumulative ont les propriétés suivantes :

  • La probabilité qu’une variable aléatoire prenne une valeur inférieure à la plus petite valeur possible est nulle. Par exemple, la probabilité qu’un dé tombe sur une valeur inférieure à 1 est nulle.
  • La probabilité qu’une variable aléatoire prenne une valeur inférieure ou égale à la plus grande valeur possible est de un. Par exemple, la probabilité qu’un dé tombe sur une valeur de 1, 2, 3, 4, 5 ou 6 est de un. Il doit atterrir sur l’un de ces numéros.
  • Le cdf est toujours non décroissant. C’est-à-dire que la probabilité qu’un dé tombe sur un nombre inférieur ou égal à 1 est de 1/6, la probabilité qu’il tombe sur un nombre inférieur ou égal à 2 est de 2/6, la probabilité qu’il tombe sur un nombre inférieur ou égal à 3 vaut 3/6, etc. Les probabilités cumulées sont toujours non décroissantes.

Connexe : Vous pouvez utiliser un graphique en ogive pour visualiser une fonction de distribution cumulative.

La relation entre un CDF et un PDF

En termes techniques, une fonction de densité de probabilité (pdf) est la dérivée d’une fonction de distribution cumulative (cdf).

De plus, l’aire sous la courbe d’une pdf entre moins l’infini et x est égale à la valeur de x sur la cdf.

Pour une explication approfondie de la relation entre un pdf et un cdf, ainsi que la preuve pourquoi le pdf est la dérivée du cdf, reportez-vous à un manuel de statistique.

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *