Comment effectuer des tests d’exécution en Python
Le test d’exécution est un test statistique utilisé pour déterminer si un ensemble de données provient ou non d’un processus aléatoire.
Les hypothèses nulles et alternatives du test sont les suivantes :
H 0 (null) : les données ont été produites de manière aléatoire.
H a (alternative) : Les données n’ont pas été produites de manière aléatoire.
Ce didacticiel explique deux méthodes que vous pouvez utiliser pour effectuer des tests Runs en Python.
Exemple : exécute un test en Python
Nous pouvons effectuer des tests Runs sur un ensemble de données donné en Python en utilisant la fonction runstest_1samp() de la bibliothèque statsmodels , qui utilise la syntaxe suivante :
runstest_1samp(x, cutoff=’mean’, correction=True)
où:
- x : Tableau de valeurs de données
- cutoff : le seuil à utiliser pour diviser les données en grandes et petites valeurs. La valeur par défaut est « moyenne », mais vous pouvez également spécifier « médiane » comme alternative.
- correction : pour une taille d’échantillon inférieure à 50, cette fonction soustrait 0,5 à titre de correction. Vous pouvez spécifier False pour désactiver cette correction.
Cette fonction produit une statistique de test z et une valeur p correspondante en sortie.
Le code suivant montre comment effectuer le test Run à l’aide de cette fonction en Python :
from statsmodels.sandbox.stats.runs import runstest_1samp #create dataset data = [12, 16, 16, 15, 14, 18, 19, 21, 13, 13] #Perform Runs test runstest_1samp(data, correction=False) (-0.6708203932499369, 0.5023349543605021)
La statistique du test z s’avère être de -0,67082 et la valeur p correspondante est de 0,50233 . Puisque cette valeur p n’est pas inférieure à α = 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle. Nous disposons de suffisamment de preuves pour affirmer que les données ont été produites de manière aléatoire.
Remarque : Pour cet exemple, nous avons désactivé la correction lors du calcul de la statistique du test. Cela correspond à la formule utilisée pour effectuer un test Runs dans R , qui n’utilise pas de correction lors de l’exécution du test.