Comment effectuer des tests d’exécution dans R
Le test d’exécution est un test statistique utilisé pour déterminer si un ensemble de données provient ou non d’un processus aléatoire.
Les hypothèses nulles et alternatives du test sont les suivantes :
H 0 (null) : les données ont été produites de manière aléatoire.
H a (alternative) : Les données n’ont pas été produites de manière aléatoire.
Ce didacticiel explique deux méthodes que vous pouvez utiliser pour effectuer le test Runs dans R. Notez que les deux méthodes conduisent aux mêmes résultats d’examen.
Méthode 1 : exécuter le test à l’aide de la bibliothèque snpar
La première façon d’effectuer le test de Run consiste à utiliser la fonction runs.test() de la bibliothèque snpar , qui utilise la syntaxe suivante :
runs.test(x, exact = FALSE, alternative = c(« two.side », « moins », « plus grand »))
où:
- x : un vecteur numérique de valeurs de données.
- exact : indique si une valeur p exacte doit être calculée. C’est FAUX par défaut. Si le nombre d’exécutions est assez petit, vous pouvez le remplacer par TRUE.
- alternative : indique l’hypothèse alternative. La valeur par défaut est recto verso.
Le code suivant montre comment effectuer le test Run à l’aide de cette fonction dans R :
library(snpar) #create dataset data <- c(12, 16, 16, 15, 14, 18, 19, 21, 13, 13) #perform Run's test runs.test(data) Approximate runs rest data: data Runs = 5, p-value = 0.5023 alternative hypothesis: two.sided
La valeur p du test est de 0,5023 . Puisque ce n’est pas inférieur à α = 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle. Nous disposons de suffisamment de preuves pour affirmer que les données ont été produites de manière aléatoire.
Méthode 2 : exécuter le test à l’aide de la bibliothèque randtests
La deuxième façon d’effectuer le test de Run consiste à utiliser la fonction runs.test() de la bibliothèque randtests , qui utilise la syntaxe suivante :
runs.test(x, alternative = c(« deux côtés », « moins », « plus grand »))
où:
- x : un vecteur numérique de valeurs de données.
- alternative : indique l’hypothèse alternative. La valeur par défaut est recto verso.
Le code suivant montre comment effectuer le test Run à l’aide de cette fonction dans R :
library(randtests) #create dataset data <- c(12, 16, 16, 15, 14, 18, 19, 21, 13, 13) #perform Run's test runs.test(data) Runs Test data: data statistic = -0.67082, runs = 5, n1 = 5, n2 = 5, n = 10, p-value = 0.5023 alternative hypothesis: nonrandomness
Encore une fois, la valeur p du test est de 0,5023 . Puisque ce n’est pas inférieur à α = 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle. Nous disposons de suffisamment de preuves pour affirmer que les données ont été produites de manière aléatoire.