Comment créer un intervalle de confiance à l’aide de la distribution F



Pour déterminer si les variances de deux populations sont égales, nous pouvons calculer le rapport de variance σ 2 1 / σ 2 2 , où σ 2 1 est la variance de la population 1 et σ 2 2 est la variance de la population 2.

Pour estimer le véritable rapport de variance de la population, nous prenons généralement un échantillon aléatoire simple de chaque population et calculons le rapport de variance de l’échantillon, s 1 2 / s 2 2 , où s 1 2 et s 2 2 sont les variances de l’échantillon pour l’échantillon 1 et l’échantillon. 2, respectivement.

Ce test suppose que s 1 2 et s 2 2 sont calculés à partir d’échantillons indépendants de taille n 1 et n 2 , tous deux issus de populations normalement distribuées.

Plus ce rapport est éloigné de un, plus les preuves de variances inégales au sein de la population sont fortes.

L’intervalle de confiance (1-α)100 % pour σ 2 1 / σ 2 2 est défini comme :

(s 1 2 / s 2 2 ) * F n 1 -1, n 2 -1, α/2 ≤ σ 2 1 / σ 2 2 ≤ (s 1 2 / s 2 2 ) * F n 2 -1, n 1 -1, α/2

où F n 2 -1, n 1 -1, α/2 et F n 1 -1, n 2 -1, α/2   sont les valeurs critiques de la distribution F pour le niveau de signification α choisi.

Les exemples suivants illustrent comment créer un intervalle de confiance pour σ 2 1 / σ 2 2 en utilisant trois méthodes différentes :

  • Par la main
  • Utiliser Microsoft Excel
  • Utilisation du logiciel statistique R

Pour chacun des exemples suivants, nous utiliserons les informations suivantes :

  • α = 0,05
  • n 1 = 16
  • n2 = 11
  • s 1 2 =28,2
  • s 2 2 = 19,3

Création manuelle d’un intervalle de confiance

Pour calculer manuellement un intervalle de confiance pour σ 2 1 / σ 2 2 , nous allons simplement insérer les nombres dont nous disposons dans la formule de l’intervalle de confiance :

(s 1 2 / s 2 2 ) * F n1-1, n2-1,α/2 ≤ σ 2 1 / σ 2 2 ≤ (s 1 2 / s 2 2 ) * F n2-1, n1-1, α/2

Les seuls chiffres qui nous manquent sont les valeurs critiques. Heureusement, nous pouvons localiser ces valeurs critiques dans le tableau de distribution F :

F n2-1, n1-1, α/2 = F 10, 15, 0,025 = 3,0602

F n1-1, n2-1, α/2 = 1/ F 15, 10, 0,025 = 1 / 3,5217 = 0,2839

(Cliquez pour zoomer sur le tableau)

Tableau de distribution F pour alpha = 0,025.

Nous pouvons maintenant intégrer tous les nombres dans la formule de l’intervalle de confiance :

(s 1 2 / s 2 2 ) * F n1-1, n2-1,α/2 ≤ σ 2 1 / σ 2 2 ≤ (s 1 2 / s 2 2 ) * F n2-1, n1-1, α/2

(28,2 / 19,3) * (0,2839) ≤ σ 2 1 / σ 2 2 ≤ (28,2 / 19,3) * (3,0602)

0,4148 ≤ σ 2 1 / σ 2 2 ≤ 4,4714

Ainsi, l’intervalle de confiance à 95 % pour le rapport des variances de la population est (0,4148, 4,4714) .

Création d’un intervalle de confiance à l’aide d’Excel

L’image suivante montre comment calculer un intervalle de confiance à 95 % pour le rapport des variances de la population dans Excel. Les limites inférieure et supérieure de l’intervalle de confiance sont affichées dans la colonne E et la formule utilisée pour trouver les limites inférieure et supérieure est affichée dans la colonne F :

Ainsi, l’intervalle de confiance à 95 % pour le rapport des variances de la population est (0,4148, 4,4714) . Cela correspond à ce que nous avons obtenu lorsque nous avons calculé manuellement l’intervalle de confiance.

Création d’un intervalle de confiance à l’aide de R

Le code suivant illustre comment calculer un intervalle de confiance à 95 % pour le rapport des variances de population dans R :

#define significance level, sample sizes, and sample variances
alpha <- .05
n1    <- 16
n2    <- 11
var1  <- 28.2
var2  <- 19.3

#define F critical values
upper_crit <- 1/qf(alpha/2, n1-1, n2-1)
lower_crit <- qf(alpha/2, n2-1, n1-1)

#find confidence interval
lower_bound <- (var1/var2) * lower_crit
upper_bound <- (var1/var2) * upper_crit

#output confidence interval
paste0("(", lower_bound, ", ", upper_bound, " )")

#[1] "(0.414899337980266, 4.47137571035219 )"

Ainsi, l’intervalle de confiance à 95 % pour le rapport des variances de la population est (0,4148, 4,4714) . Cela correspond à ce que nous avons obtenu lorsque nous avons calculé manuellement l’intervalle de confiance.

Ressources additionnelles

Comment lire le tableau de distribution F
Comment trouver la valeur critique F dans Excel

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *