Estimation d’intervalle

Cet article explique en quoi consiste l’estimation d’intervalle en statistique. Vous découvrirez également comment est effectuée l’estimation par intervalles et, enfin, en quoi l’estimation par intervalles diffère de l’estimation ponctuelle.

Qu’est-ce que l’estimation d’intervalle ?

En statistiques, l’estimation par intervalle est un processus dans lequel la valeur d’un paramètre de population est estimée à l’aide d’un intervalle. Plus précisément, l’estimation d’intervalle consiste à calculer l’intervalle dans lequel la valeur du paramètre est la plus susceptible d’être trouvée avec un certain niveau de confiance .

Par exemple, si dans une estimation par intervalles on arrive à la conclusion que l’intervalle de confiance pour la moyenne de la population est (3,7) avec un niveau de confiance de 95 %, cela signifie que la moyenne de la population étudiée sera comprise entre 3 et 7 avec une probabilité de 95%.

En général, la taille d’une population est trop grande pour étudier tous ses individus, de sorte que la valeur de ses mesures statistiques ne peut être connue avec certitude, mais plutôt une approximation.

Ainsi, l’estimation par intervalle sert à donner, sur la base de données d’échantillon, une approximation de la plage de valeurs entre laquelle se trouve le paramètre de population. De cette manière, la valeur du paramètre de population peut être estimée à partir des données étudiées à partir d’un échantillon.

Enfin, pour bien comprendre la signification de l’estimation par intervalle, vous devez être clair sur le concept d’intervalle de confiance. Un intervalle de confiance est l’intervalle qui fournit, avec une marge d’erreur, une approximation des valeurs entre lesquelles se situe la valeur d’un paramètre de population. Par conséquent, l’intervalle de confiance est le résultat obtenu à partir d’une estimation d’intervalle.

Formules d’estimation d’intervalle

Vous trouverez ci-dessous les différentes formules pour estimer les intervalles de confiance, puisque selon que l’on souhaite estimer l’intervalle de confiance pour la moyenne, pour la variance ou pour la proportion, la formule à utiliser est différente.

Intervalle de confiance pour la moyenne

En supposant que le processus de saisie d’une variable se déroule comme suit :

Z=\cfrac{X-\mu}{\displaystyle\frac{\sigma}{\sqrt{n}}} \sim N(0,1)

L’intervalle de confiance pour la moyenne est calculé en ajoutant et en soustrayant de la moyenne de l’échantillon la valeur de Z α/2 multipliée par l’écart type (σ) et divisée par la racine carrée de la taille de l’échantillon (n). Par conséquent, la formule pour calculer l’intervalle de confiance de la moyenne est la suivante :

\displaystyle \left(\overline{x}-z_{\alpha/2}\cdot \frac{\sigma}{\sqrt{n}} \ , \ \overline{x}+z_{\alpha/2}\cdot \frac{\sigma}{\sqrt{n}} \right)

Pour des échantillons de grande taille et un niveau de confiance de 95 %, la valeur critique est Z α/2 = 1,96 et pour un niveau de confiance de 99 %, la valeur critique est Z α/2 = 2,576.

La formule ci-dessus est utilisée lorsque la variance de la population est connue. Cependant, si la variance de la population est inconnue, ce qui est le cas le plus courant, l’intervalle de confiance pour la moyenne est calculé à l’aide de la formule suivante :

\displaystyle \left(\overline{x}-t_{\alpha/2}\cdot \frac{s}{\sqrt{n}} \ , \ \overline{x}+t_{\alpha/2}\cdot \frac{s}{\sqrt{n}} \right)

Où:

  • \overline{x} est la moyenne de l’échantillon.
  • t_{\alpha/2} est la valeur de la distribution t de Student de n-1 degrés de liberté avec une probabilité de α/2.
  • s est l’écart type de l’échantillon.
  • n est la taille de l’échantillon.
intervalle de confiance

Intervalle de confiance pour la variance

Pour calculer l’intervalle de confiance pour la variance d’une population, la distribution du chi carré est utilisée. Plus précisément, la formule pour calculer l’intervalle de confiance pour la variance est la suivante :

\displaystyle \left( (n-1)\frac{s^2}{\chi_{n-1;\alpha/2}} \ , \ (n-1)\frac{s^2}{\chi_{n-1;1-\alpha/2}}\right)

Où:

  • n est la taille de l’échantillon.
  • s est l’écart type de l’échantillon.
  • \chi_{n-1;\alpha/2} est la valeur de la distribution du Chi carré avec n-1 degrés de liberté pour une probabilité inférieure à α/2.
  • \chi_{n-1;1-\alpha/2} est la valeur de la distribution du Chi carré avec n-1 degrés de liberté pour une probabilité supérieure à 1-α/2.

Intervalle de confiance pour la proportion

L’intervalle de confiance pour la proportion est calculé en ajoutant et en soustrayant de la proportion de l’échantillon la valeur de Z α/2 multipliée par la racine carrée de la proportion de l’échantillon (p) multipliée par 1-p et divisée par la taille de l’échantillon ( n). Par conséquent, la formule pour calculer l’intervalle de confiance pour la proportion est la suivante :

\displaystyle \left(p-Z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}\ , \ p+Z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}\right)

Où:

  • p est la proportion de l’échantillon.
  • n est la taille de l’échantillon.
  • Z_{\alpha/2} est le quantile de la distribution normale standard correspondant à une probabilité de α/2. Pour des échantillons de grande taille et un niveau de confiance de 95 %, il est généralement proche de 1,96 et pour un niveau de confiance de 99 %, il est généralement proche de 2,576.

Estimation d’intervalle et estimation de points

Enfin, nous verrons quelles sont les différences entre l’estimation par intervalles et l’estimation ponctuelle, puisque la valeur d’un paramètre de population peut être estimée au moyen d’un intervalle (comme nous l’avons vu tout au long de l’article) ou au moyen d’une valeur ponctuelle.

La différence entre l’estimation d’intervalle et l’estimation ponctuelle est la plage de valeurs utilisées dans l’estimation du paramètre. Dans l’estimation par intervalles, un paramètre est approché à un intervalle de confiance, tandis que dans l’estimation ponctuelle, le paramètre est approché à une valeur spécifique.

Par conséquent, dans l’estimation ponctuelle, une valeur unique, calculée à partir des données d’échantillon, est considérée comme une approximation de la valeur du paramètre de population. Par exemple, la moyenne de la population peut être estimée avec précision à l’aide de la moyenne de l’échantillon.

Ainsi, l’estimation ponctuelle présente des avantages et des inconvénients par rapport à l’estimation par intervalles, de sorte que chaque type d’estimation est approprié pour une utilisation dans une situation donnée. Pour en savoir plus, cliquez sur le lien suivant :

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *