Comment effectuer des tests d’exécution en Python



Le test d’exécution est un test statistique utilisé pour déterminer si un ensemble de données provient ou non d’un processus aléatoire.

Les hypothèses nulles et alternatives du test sont les suivantes :

H 0 (null) : les données ont été produites de manière aléatoire.

H a (alternative) : Les données n’ont pas été produites de manière aléatoire.

Ce didacticiel explique deux méthodes que vous pouvez utiliser pour effectuer des tests Runs en Python.

Exemple : exécute un test en Python

Nous pouvons effectuer des tests Runs sur un ensemble de données donné en Python en utilisant la fonction runstest_1samp() de la bibliothèque statsmodels , qui utilise la syntaxe suivante :

runstest_1samp(x, cutoff=’mean’, correction=True)

où:

  • x : Tableau de valeurs de données
  • cutoff : le seuil à utiliser pour diviser les données en grandes et petites valeurs. La valeur par défaut est « moyenne », mais vous pouvez également spécifier « médiane » comme alternative.
  • correction : pour une taille d’échantillon inférieure à 50, cette fonction soustrait 0,5 à titre de correction. Vous pouvez spécifier False pour désactiver cette correction.

Cette fonction produit une statistique de test z et une valeur p correspondante en sortie.

Le code suivant montre comment effectuer le test Run à l’aide de cette fonction en Python :

from statsmodels.sandbox.stats.runs import runstest_1samp 

#create dataset
data = [12, 16, 16, 15, 14, 18, 19, 21, 13, 13]

#Perform Runs test
runstest_1samp(data, correction=False)

(-0.6708203932499369, 0.5023349543605021)

La statistique du test z s’avère être de -0,67082 et la valeur p correspondante est de 0,50233 . Puisque cette valeur p n’est pas inférieure à α = 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle. Nous disposons de suffisamment de preuves pour affirmer que les données ont été produites de manière aléatoire.

Remarque : Pour cet exemple, nous avons désactivé la correction lors du calcul de la statistique du test. Cela correspond à la formule utilisée pour effectuer un test Runs dans R , qui n’utilise pas de correction lors de l’exécution du test.

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *