Test d’hypothèse pour la différence de moyennes

Cet article explique ce qu’est le test d’hypothèse sur la différence de moyennes dans les statistiques et à quoi il sert. De même, vous découvrirez comment faire un test d’hypothèse sur la différence de moyennes et un exercice résolu étape par étape.

Qu’est-ce que le test d’hypothèse pour la différence moyenne ?

Le test d’hypothèse pour la différence de moyennes est un test statistique utilisé pour rejeter ou accepter l’hypothèse selon laquelle les moyennes de deux populations sont différentes. Autrement dit, le test d’hypothèse sur la différence de moyennes est utilisé pour déterminer si les moyennes de deux populations sont identiques ou différentes.

Gardez à l’esprit que les décisions prises dans les tests d’hypothèse sont basées sur un niveau de confiance préalablement établi, on ne peut donc pas garantir que le résultat d’un test d’hypothèse est toujours correct, mais plutôt que c’est le résultat le plus probable qui est vrai.

Le test d’hypothèse pour la différence de deux moyennes consiste à calculer la statistique du test et à la comparer à la valeur critique pour rejeter ou non l’hypothèse nulle. Ci-dessous, nous verrons comment effectuer un test d’hypothèse pour la différence de moyennes.

Enfin, rappelez-vous qu’en statistique, les tests d’hypothèses peuvent également être appelés contrastes d’hypothèses, tests d’hypothèses ou tests de signification.

Formule de test d’hypothèse pour la différence de moyennes

La formule qui doit être utilisée pour tester les hypothèses sur la différence des moyennes varie selon que les variances de la population sont connues et, dans le cas contraire, si elles peuvent être supposées identiques ou différentes. Ainsi, dans cette section, nous verrons quelle formule utiliser selon les cas.

Variations connues

La formule de calcul de la statistique du test d’hypothèse pour la différence des moyennes lorsque les variances sont connues est la suivante :

\displaystyle Z=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}

Où:

  • Z est la statistique de test d’hypothèse pour la différence de deux moyennes avec une variance connue, qui suit une distribution normale standard.
  • \mu_1 est la moyenne de la population 1.
  • \mu_2 est la moyenne de la population 2.
  • \overline{x_1} est la moyenne de l’échantillon 1.
  • \overline{x_2} est la moyenne de l’échantillon 2.
  • \sigma_1 est l’écart type de la population 1.
  • \sigma_2 est l’écart type de la population 2.
  • n_1 est la taille de l’échantillon 1.
  • n_2 est la taille de l’échantillon 2.

Gardez à l’esprit qu’il s’agit du cas le moins courant, cette formule n’est donc utilisée que dans certains cas spécifiques.

Écarts inconnus et égaux

La formule permettant de calculer la statistique du test d’hypothèse pour la différence des moyennes lorsque les variances de la population sont inconnues mais supposées égales est la suivante :

\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}

Où:

  • t est la statistique de test d’hypothèse pour la différence de moyennes avec des variances inconnues, qui suit une distribution t de Student avec n 1 + n 2 -2 degrés de liberté.
  • \mu_1 est la moyenne de la population 1.
  • \mu_2 est la moyenne de la population 2.
  • \overline{x_1} est la moyenne de l’échantillon 1.
  • \overline{x_2} est la moyenne de l’échantillon 2.
  • s_p est l’écart type combiné.
  • n_1 est la taille de l’échantillon 1.
  • n_2 est la taille de l’échantillon 2.

L’écart type combiné des deux échantillons est calculé avec la formule suivante :

\displaystyle s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}

Variations inconnues et différentes

Lorsque les variances des populations sont inconnues et, en outre, elles sont supposées différentes, la formule pour calculer la statistique du test d’hypothèse pour la différence des moyennes est la suivante :

\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle \sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}

Où:

  • t est la statistique de test d’hypothèse pour la différence de moyennes avec des variances inconnues, qui suit la distribution t de Student.
  • \mu_1 est la moyenne de la population 1.
  • \mu_2 est la moyenne de la population 2.
  • \overline{x_1} est la moyenne de l’échantillon 1.
  • \overline{x_2} est la moyenne de l’échantillon 2.
  • \sigma_1 est l’écart type de la population 1.
  • \sigma_2 est l’écart type de la population 2.
  • n_1 est la taille de l’échantillon 1.
  • n_2 est la taille de l’échantillon 2.

Cependant, dans ce cas, les degrés de liberté de la distribution t de Student sont calculés à l’aide de la formule suivante :

\displaystyle GL=\frac{\displaystyle\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\displaystyle\frac{\displaystyle\frac{s_1^2}{n_1}}{n_1-1}+\frac{\displaystyle\frac{s_2^2}{n_2}}{n_2-1}}

Exemple concret du test d’hypothèse pour la différence de moyennes

Pour finir d’assimiler le concept de test d’hypothèse sur la différence de moyennes, nous allons voir un exemple concret de ce type de test d’hypothèse.

  • Vous souhaitez faire une étude statistique sur le salaire de deux entreprises concurrentes, plus précisément, vous souhaitez déterminer si le salaire moyen des deux entreprises est différent. Pour ce faire, un échantillon de 47 travailleurs d’une entreprise et un autre échantillon de 55 travailleurs de l’autre entreprise sont prélevés. Un salaire moyen de 40 000 $ et un écart type de 12 000 $ sont obtenus à partir du premier échantillon, tandis qu’un salaire moyen de 46 000 $ et un écart type de 18 000 $ sont obtenus à partir du deuxième échantillon. Effectuez un test d’hypothèse avec un niveau de signification de 5 % pour déterminer si les salaires moyens sont différents ou non.

Dans ce cas, l’hypothèse nulle et l’hypothèse alternative du test d’hypothèse pour la différence des deux moyennes sont les suivantes :

\begin{cases}H_0: \mu_1-\mu_2=0\\[2ex] H_1:\mu_1-\mu_2\neq 0 \end{cases}

Dans ce cas, les écarts des populations ne sont pas connus, mais on peut supposer qu’elles sont égales car ce sont des entreprises concurrentes et les conditions de travail du marché dans lequel elles opèrent sont très similaires. Par conséquent, la formule pour la statistique de test d’hypothèse pour la différence de moyennes que nous devons utiliser est la suivante :

\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}

Nous calculons donc l’écart type poolé des deux échantillons :

\begin{aligned}\displaystyle s_p&=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}\\[2ex]\displaystyle s_p&=\sqrt{\frac{(47-1)\cdot 12000^2+(55-1)\cdot 18000^2}{47+55-2}}\\[2ex]s_p&=15530,61\end{aligned}

Nous appliquons maintenant la formule du test d’hypothèse pour la différence de moyennes :

\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}=\cfrac{(40000-46000)-0}{\displaystyle 15530,61\sqrt{\frac{1}{47}+\frac{1}{55}}}=-1,94

En revanche, on recherche la valeur critique du test d’hypothèse pour la différence de moyennes dans le tableau t de Student :

\alpha=0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \alpha/2=0,025

\begin{array}{c}t_{\alpha/2| n_1+n_2-2}= \ \color{orange}\bm{?}\\[4ex]t_{0,025| 100}=1,984\end{array}

Ensuite, puisque la valeur absolue de la statistique du test est inférieure à la valeur critique du test, l’hypothèse nulle est acceptée et l’hypothèse alternative est rejetée.

|-1,94|=1,94<1,984 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Se rechaza } H_1

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *