Que sont les intervalles de confiance ?



Souvent, dans les statistiques, nous nous intéressons à la mesure des paramètres d’une population , c’est-à-dire des chiffres qui décrivent certaines caractéristiques d’une population entière.

Deux des paramètres de population les plus courants sont :

1. Moyenne de la population : la valeur moyenne d’une variable dans une population (par exemple, la taille moyenne des hommes aux États-Unis)

2. Proportion de population : la proportion d’une variable dans une population (par exemple, la proportion de résidents d’un comté qui soutiennent une certaine loi)

Même si nous souhaitons mesurer ces paramètres, il est généralement trop coûteux et prend trop de temps de collecter des données sur chaque individu d’une population afin de calculer le paramètre de population.

Au lieu de cela, nous prenons généralement un échantillon aléatoire de la population globale et utilisons les données de l’échantillon pour estimer le paramètre de population.

Par exemple, supposons que nous souhaitions estimer le poids moyen d’une certaine espèce de tortue en Floride. Comme il y a des milliers de tortues en Floride, il serait extrêmement long et coûteux de faire le tour et de peser chaque tortue individuellement.

Au lieu de cela, nous pourrions prendre un échantillon aléatoire simple de 50 tortues et utiliser le poids moyen des tortues dans cet échantillon pour estimer la moyenne réelle de la population :

Échantillon d'un exemple de population

Le problème est qu’il n’est pas garanti que le poids moyen des tortues de l’échantillon corresponde exactement au poids moyen des tortues de l’ensemble de la population. Par exemple, il se peut que nous choisissions un échantillon rempli de tortues de faible poids ou peut-être un échantillon rempli de tortues lourdes.

Afin de capturer cette incertitude, nous pouvons créer un intervalle de confiance. Un intervalle de confiance est une plage de valeurs susceptible de contenir un paramètre de population avec un certain niveau de confiance. Il est calculé selon la formule générale suivante :

Intervalle de confiance = (estimation ponctuelle) +/- (valeur critique)* (erreur type)

Cette formule crée un intervalle avec une limite inférieure et une limite supérieure, qui contient probablement un paramètre de population avec un certain niveau de confiance.

Intervalle de confiance = [limite inférieure, limite supérieure]

Par exemple, la formule permettant de calculer un intervalle de confiance pour une moyenne de population est la suivante :

Intervalle de confiance = x +/- z*(s/√ n )

où:

  • x : moyenne de l’échantillon
  • z : la valeur z choisie
  • s : écart type de l’échantillon
  • n : taille de l’échantillon

La valeur z que vous utiliserez dépend du niveau de confiance que vous choisissez. Le tableau suivant montre la valeur z qui correspond aux choix de niveaux de confiance les plus courants :

Un niveau de confiance valeur z
0,90 1,645
0,95 1,96
0,99 2,58

Par exemple, supposons que nous collections un échantillon aléatoire de tortues avec les informations suivantes :

  • Taille de l’échantillon n = 25
  • Poids moyen de l’échantillon x = 300
  • Écart type de l’échantillon s = 18,5

Voici comment calculer l’intervalle de confiance à 90 % pour le poids moyen réel de la population :

Intervalle de confiance à 90 % : 300 +/- 1,645*(18,5/√25) = [293,91, 306,09]

Nous interprétons cet intervalle de confiance comme suit :

Il y a 90 % de chances que l’intervalle de confiance de [293,91, 306,09] contienne le poids moyen réel de la population de tortues.

Une autre façon de dire la même chose est qu’il n’y a que 10 % de chances que la véritable moyenne de la population se situe en dehors de l’intervalle de confiance de 90 %. Autrement dit, il n’y a que 10 % de chances que le poids moyen réel de la population de tortues soit supérieur à 306,09 livres ou inférieur à 293,91 livres.

Cela ne vaut rien qu’il existe deux nombres qui peuvent affecter la taille d’un intervalle de confiance :

1. La taille de l’échantillon : plus la taille de l’échantillon est grande, plus l’intervalle de confiance est étroit.

2. Le niveau de confiance : Plus le niveau de confiance est élevé, plus l’intervalle de confiance est large.

Types d’intervalles de confiance

Il existe de nombreux types d’intervalles de confiance. Voici les plus couramment utilisés :

Intervalle de confiance pour une moyenne

Un intervalle de confiance pour une moyenne est une plage de valeurs susceptible de contenir une moyenne de population avec un certain niveau de confiance. La formule pour calculer cet intervalle est la suivante :

Intervalle de confiance = x +/- z*(s/√ n )

où:

  • x : moyenne de l’échantillon
  • z : la valeur z choisie
  • s : écart type de l’échantillon
  • n : taille de l’échantillon

Ressources:
Comment calculer un intervalle de confiance pour une moyenne
Intervalle de confiance pour un calculateur de moyenne

Intervalle de confiance pour la différence entre les moyennes

Un intervalle de confiance (IC) pour une différence entre des moyennes est une plage de valeurs susceptible de contenir la véritable différence entre deux moyennes de population avec un certain niveau de confiance. La formule pour calculer cet intervalle est la suivante :

Intervalle de confiance = ( x 1x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))

où:

  • x 1 , x 2 : moyenne de l’échantillon 1, moyenne de l’échantillon 2
  • t : la valeur t-critique basée sur le niveau de confiance et (n 1 + n 2 -2) degrés de liberté
  • s p 2 : variance poolée
  • n 1 , n 2 : taille de l’échantillon 1, taille de l’échantillon 2

où:

  • La variance groupée est calculée comme suit : s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
  • La valeur t-critique t peut être trouvée à l’aide du calculateur de distribution t inverse.

Ressources:
Comment calculer un intervalle de confiance pour la différence entre les moyennes
Intervalle de confiance pour la différence entre les moyennes Calculatrice

Intervalle de confiance pour une proportion

Un intervalle de confiance pour une proportion est une plage de valeurs susceptible de contenir une proportion de population avec un certain niveau de confiance. La formule pour calculer cet intervalle est la suivante :

Intervalle de confiance = p +/- z*(√ p(1-p) / n )

où:

  • p : proportion de l’échantillon
  • z : la valeur z choisie
  • n : taille de l’échantillon

Ressources:
Comment calculer un intervalle de confiance pour une proportion
Intervalle de confiance pour un calculateur de proportion

Intervalle de confiance pour la différence de proportions

Un intervalle de confiance pour la différence de proportions est une plage de valeurs susceptible de contenir la véritable différence entre deux proportions de population avec un certain niveau de confiance. La formule pour calculer cet intervalle est la suivante :

Intervalle de confiance = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )

où:

  • p 1 , p 2 : proportion de l’échantillon 1, proportion de l’échantillon 2
  • z : la valeur z-critique basée sur le niveau de confiance
  • n 1 , n 2 : taille de l’échantillon 1, taille de l’échantillon 2

Ressources:
Comment calculer un intervalle de confiance pour la différence de proportions
Intervalle de confiance pour le calculateur de différence de proportions

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *