Test G de l’adéquation de l’ajustement : définition + exemple



En statistiques, le test G de la qualité de l’ajustement est utilisé pour déterminer si une variable catégorielle suit ou non une distribution hypothétique.

Ce test est une alternative au test d’adéquation du chi carré et est souvent utilisé lorsque des valeurs aberrantes sont présentes dans les données ou lorsque les données avec lesquelles vous travaillez sont extrêmement volumineuses.

Le G-Test de qualité de l’ajustement utilise les hypothèses nulles et alternatives suivantes :

  • H 0 : Une variable suit une distribution hypothétique.
  • H A : Une variable ne suit pas une distribution hypothétique.

La statistique du test est calculée comme suit :

G=2 * Σ[O * ln(O/E)]

où:

  • O : Le nombre observé dans une cellule
  • E : Le nombre attendu dans une cellule

Si la valeur p qui correspond à la statistique de test est inférieure à un certain niveau de signification , vous pouvez alors rejeter l’hypothèse nulle et conclure que la variable étudiée ne suit pas la distribution hypothétique.

L’exemple suivant montre comment effectuer un test G de qualité d’ajustement dans la pratique.

Exemple : test G de l’adéquation de l’ajustement

Un biologiste affirme qu’une proportion égale de trois espèces de tortues existe dans une certaine zone. Pour tester cette affirmation, un chercheur indépendant compte le nombre de chaque type d’espèce et trouve ce qui suit :

  • Espèce A : 80
  • Espèce B : 125
  • Espèce C : 95

La chercheuse indépendante peut utiliser les étapes suivantes pour effectuer un test G de qualité d’ajustement afin de déterminer si les données qu’elle a collectées sont cohérentes avec les affirmations du biologiste.

Étape 1 : Énoncer les hypothèses nulles et alternatives.

Le chercheur effectuera le test G de qualité de l’ajustement en utilisant les hypothèses suivantes :

  • H 0 : Une proportion égale de trois espèces de tortues existent dans cette zone.
  • H A : Une proportion égale de trois espèces de tortues n’existe pas dans cette zone.

Étape 2 : Calculez la statistique du test.

La formule pour calculer la statistique du test est la suivante :

G=2 * Σ[O * ln(O/E)]

Dans cet exemple, il y a 300 tortues au total observées. S’il y avait une proportion égale de chaque espèce, nous nous attendrions à observer 100 tortues de chaque espèce. Ainsi, nous pouvons calculer la statistique du test comme suit :

G = 2 * [80*ln(80/100) + 125*ln(125/100) + 95*ln(95/100)] = 10,337

Étape 3 : Calculez la valeur p de la statistique de test.

Selon le calculateur du chi carré à la valeur P , la valeur p associée à une statistique de test de 10,337 et #categories-1 = 3-1 = 2 degrés de liberté est de 0,005693 .

Puisque cette valeur p est inférieure à 0,05, le chercheur rejetterait l’hypothèse nulle. Cela signifie qu’elle dispose de suffisamment de preuves pour affirmer qu’une proportion égale de chaque espèce de tortue n’existe pas dans cette zone particulière.

Bonus : test G de la qualité de l’ajustement dans R

Vous pouvez utiliser la fonction Gtest() du package DescTools pour effectuer rapidement un test G de qualité d’ajustement dans R.

Le code suivant montre comment effectuer un test G pour l’exemple précédent :

#load the DescTools library
library(DescTools)

#perform the G-test 
GTest(x = c(80, 125, 95), #observed values
      p = c(1/3, 1/3, 1/3), #expected proportions
      correct = "none") 

	Log likelihood ratio (G-test) goodness of fit test

data:  c(80, 125, 95)
G = 10.337, X-squared df = 2, p-value = 0.005693

Notez que la statistique du test G est de 10,337 et la valeur p correspondante est de 0,005693 . Puisque cette valeur p est inférieure à 0,05, nous rejetterions l’hypothèse nulle.

Cela correspond aux résultats que nous avons calculés manuellement.

Ressources additionnelles

N’hésitez pas à utiliser ce calculateur de test G de qualité d’ajustement pour effectuer automatiquement un test G pour n’importe quel ensemble de données.

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *