Comment diriger Grubbs’ Tester sous Excel
Le test de Grubbs est un test statistique qui peut être utilisé pour identifier la présence d’une valeur aberrante dans un ensemble de données. Pour utiliser ce test, l’ensemble de données que vous analysez doit être à peu près normalement distribué et, idéalement, doit contenir au moins 7 observations.
Remarque : Si vous pensez qu’il existe plusieurs valeurs aberrantes dans l’ensemble de données, vous devez plutôt utiliser le test d’écart étudiant extrême généralisé pour les valeurs aberrantes .
Si vous pensez que la valeur maximale de l’ensemble de données est une valeur aberrante, la statistique de test est calculée comme suit :
G = (x max – x ) / s
Si vous pensez que la valeur minimale de l’ensemble de données est une valeur aberrante, la statistique de test est calculée comme suit :
G = ( x – x min ) / s
Et si vous n’êtes pas sûr que la valeur maximale ou la valeur minimale de l’ensemble de données soit une valeur aberrante et que vous souhaitez effectuer un test bilatéral, la statistique du test est calculée comme suit :
G = max|x je – x | /s
où x est la moyenne de l’échantillon et s est l’écart type de l’échantillon.
La valeur critique du test est calculée comme suit :
G critique = (n-1)t critique / √[n(n-2 + t 2 critique )]
où t critique est la valeur critique de la distribution t avec n-2 degrés de liberté et le niveau de signification est α/n pour un test unilatéral et α/(2n) pour un test bilatéral.
Exemple : test de Grubbs dans Excel
Déterminez si la valeur 60 est ou non une valeur aberrante dans l’ensemble de données suivant :
Étape 1 : Tout d’abord, nous devons nous assurer que les données sont distribuées à peu près normalement. Pour ce faire, nous pouvons créer un histogramme pour vérifier que la distribution a grossièrement une forme de cloche. La capture d’écran suivante montre comment créer un histogramme dans Excel à l’aide du Data Analysis ToolPak :
À partir de l’histogramme, nous pouvons voir que les données sont distribuées à peu près normalement. Cela signifie que nous pouvons procéder au test de Grubbs.
Étape 2 : Ensuite, nous effectuerons le test de Grubbs pour déterminer si la valeur 60 est réellement une valeur aberrante dans l’ensemble de données. La capture d’écran ci-dessous montre les formules à utiliser pour effectuer le test de Grubbs :
La statistique de test, G , dans la cellule D4 est 3.603219 .
La valeur critique, G critique , dans la cellule D11 est 2,556581 . Étant donné que la statistique du test est supérieure à la valeur critique, cela signifie que la valeur 60 est effectivement une valeur aberrante dans cet ensemble de données.
Que faire si une valeur aberrante est identifiée
Si le test de Grubbs identifie une valeur aberrante dans votre ensemble de données, vous disposez de plusieurs options :
- Vérifiez à nouveau pour vous assurer que la valeur n’est pas une faute de frappe ou une erreur de saisie de données. Parfois, les valeurs qui apparaissent comme des valeurs aberrantes dans les ensembles de données sont simplement des fautes de frappe commises par un individu lors de la saisie des données. Revenez en arrière et vérifiez que la valeur a été saisie correctement avant de prendre d’autres décisions.
- Attribuez une nouvelle valeur à la valeur aberrante . Si la valeur aberrante s’avère être le résultat d’une faute de frappe ou d’une erreur de saisie de données, vous pouvez décider de lui attribuer une nouvelle valeur, telle que la moyenne ou la médiane de l’ensemble de données.
- Supprimez la valeur aberrante. Si la valeur est réellement aberrante, vous pouvez choisir de la supprimer si elle aura un impact significatif sur votre analyse globale.
Peu importe ce que vous décidez de faire avec la valeur aberrante, assurez-vous d’en prendre note lorsque vous présentez les conclusions finales de votre analyse.