Personnaliser les préférences

Nous utilisons des cookies pour vous aider à naviguer efficacement et à exécuter certaines fonctions. Vous trouverez ci-dessous des informations détaillées sur tous les cookies sous chaque catégorie de consentement.

Les cookies classés comme « Nécessaires » sont stockés sur votre navigateur car ils sont essentiels pour activer les fonctionnalités de base du site.... 

Toujours actif

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

Aucun cookie à afficher.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

Aucun cookie à afficher.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

Aucun cookie à afficher.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

Aucun cookie à afficher.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

Aucun cookie à afficher.

Intervalle de confiance pour la différence des moyennes

Cet article explique ce qu’est un intervalle de confiance pour la différence de moyennes dans les statistiques et à quoi il sert. Ainsi, vous découvrirez comment calculer l’intervalle de confiance pour la différence de deux moyennes et un exercice résolu étape par étape.

Quel est l’intervalle de confiance pour la différence de moyennes ?

L’ intervalle de confiance pour la différence des moyennes est un intervalle qui fournit une valeur maximale et une valeur minimale entre lesquelles se situe la valeur de la différence des moyennes de deux populations avec un certain niveau de confiance.

Par exemple, si l’intervalle de confiance pour la différence des moyennes de deux populations avec un niveau de confiance de 95 % est (3,5), cela signifie que la différence entre les moyennes des deux populations sera comprise entre 3 et 5 avec une probabilité de 95 %.

Par conséquent, en statistique, l’intervalle de confiance pour la différence des moyennes est utilisé pour estimer deux valeurs entre lesquelles se situe la différence entre deux moyennes de population. Ainsi, à partir des données de deux échantillons, il est possible d’approcher la différence entre les moyennes des populations.

Formule d’intervalle de confiance pour la différence de moyennes

La formule de l’intervalle de confiance pour la différence des moyennes dépend du fait que les variances de la population soient connues ou non et, dans le cas contraire, de la question de savoir si les variances de la population peuvent être supposées égales ou non. Nous verrons donc ensuite comment l’intervalle de confiance pour la différence des moyennes est calculé dans chaque cas.

écarts connus

La formule pour calculer l’intervalle de confiance pour la différence des moyennes lorsque les variances des deux populations sont connues avec un niveau de confiance de 1-α est la suivante :

\displaystyle (\overline{x_1}-\overline{x_2})\pm Z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}

Où:

  • \overline{x_i} est la moyenne de l’échantillon i.
  • \sigma_i est l’écart type de la population i.
  • Z_{\alpha/2} est la valeur de la distribution normale standard avec une probabilité α/2.
  • n_i est la taille de l’échantillon i.

Ce cas est le moins courant, puisque la valeur des variances de population est généralement inconnue.

variances inconnues et égales

Lorsque les variances des deux populations sont inconnues mais peuvent être estimées égales, la formule de calcul de l’intervalle de confiance pour la différence des moyennes avec un niveau de confiance de 1-α est la suivante :

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

Où:

  • \overline{x_i} est la moyenne de l’échantillon i.
  • s_p est l’écart type regroupé.
  • t_{\alpha/2} est la valeur de la distribution t de Student de n 1 + n 2 -2 degrés de liberté avec une probabilité de α/2.
  • n_i est la taille de l’échantillon i.

Puisque dans ce cas, on suppose que les variances de la population sont équivalentes, l’écart type combiné est utilisé pour calculer l’intervalle de confiance, qui est calculé avec la formule suivante :

\displaystyle s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}

s_i est l’écart type de l’échantillon i.

Variations inconnues et différentes

Lorsque les variances des deux populations sont inconnues et ne peuvent pas être supposées égales, la formule de calcul de l’intervalle de confiance pour la différence des moyennes avec un niveau de confiance de 1-α est la suivante :

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}

Où:

  • \overline{x_i} est la moyenne de l’échantillon i.
  • s_i est l’écart type de l’échantillon i.
  • t_{\alpha/2} est la valeur de la distribution t de Student avec une probabilité de α/2.
  • n_i est la taille de l’échantillon i.

Dans ce cas, les degrés de liberté de la distribution t de Student sont calculés à l’aide de la formule suivante :

\displaystyle GL=\frac{\displaystyle\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\displaystyle\frac{\displaystyle\frac{s_1^2}{n_1}}{n_1-1}+\frac{\displaystyle\frac{s_2^2}{n_2}}{n_2-1}}

s_i est l’écart type de l’échantillon i.

Exemple concret de l’intervalle de confiance pour la différence de moyennes

Après avoir vu la définition de l’intervalle de confiance pour la différence de moyennes et quelles sont les différentes formules, nous allons maintenant voir un exemple concret pour finir d’assimiler comment est calculé l’intervalle de confiance pour la différence de deux moyennes.

  • Nous souhaitons étudier l’effet du tabac sur le poids des enfants à la naissance. Pour ce faire, deux échantillons sont comparés : le premier échantillon est constitué d’enfants dont les mères ne fumaient pas et le deuxième échantillon est constitué d’enfants dont les mères fumaient (les paramètres de l’échantillon sont indiqués ci-dessous). Calculez l’intervalle de confiance pour la différence de moyennes avec un niveau de confiance de 95 %.
    1. Mères non fumeuses :\overline{x_1}=3,1 \ kg \quad s_1=0,6 \ kg \quad n_1=39
    2. Mères fumeuses :\overline{x_2}=3,5 \ kg \quad s_2=0,4 \ kg\quad n_2=43

Dans ce cas, nous ne connaissons pas les valeurs des variances de population, cependant, on peut supposer que les variances de population sont équivalentes car nous avons affaire à deux populations ayant des caractéristiques très similaires. Par conséquent, la formule de l’intervalle de confiance pour la différence de moyenne que nous devons utiliser est la suivante :

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

Ainsi, nous calculons l’écart type combiné à partir des écarts types des deux échantillons :

\begin{aligned}\displaystyle s_p&=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}\\[2ex]\displaystyle s_p&=\sqrt{\frac{(39-1)\cdot 0,6^2+(43-1)\cdot 0,4^2}{39+43-2}}\\[2ex]\displaystyle s_p&=0,50\end{aligned}

De même, il faut rechercher la valeur de la distribution t de Student de 80 degrés de liberté avec une probabilité de 2,5% dans le tableau de distribution de probabilité de la distribution t de Student :

1-\alpha=0,95 \ \color{orange}\bm{\longrightarrow}\color{black} \ \alpha=0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \alpha/2=0,025

\begin{array}{c}t_{\alpha/2| n_1+n_2-2}= \ \color{orange}\bm{?}\\[4ex]t_{0,025|80}=1,990\end{array}

Enfin, nous substituons les données dans la formule d’intervalle de confiance pour la différence de moyennes et effectuons les calculs :

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

\displaystyle (3,1-3,5)\pm 1,990\cdot 0,5\cdot\sqrt{\frac{1}{39}+\frac{1}{43}}

\displaystyle -0,4\pm 0,22

L’intervalle de confiance pour la différence des moyennes du problème est donc le suivant :

(-0,61,-0,18)

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *