Comment effectuer des tests d’exécution dans R

Par Dr. Benjamin Anderson juillet 27, 2023 Guide 0 commentaire

Le test d’exécution est un test statistique utilisé pour déterminer si un ensemble de données provient ou non d’un processus aléatoire.

Les hypothèses nulles et alternatives du test sont les suivantes :

H ₀ (null) : les données ont été produites de manière aléatoire.

H _a (alternative) : Les données n’ont pas été produites de manière aléatoire.

Ce didacticiel explique deux méthodes que vous pouvez utiliser pour effectuer le test Runs dans R. Notez que les deux méthodes conduisent aux mêmes résultats d’examen.

Méthode 1 : exécuter le test à l’aide de la bibliothèque snpar

La première façon d’effectuer le test de Run consiste à utiliser la fonction runs.test() de la bibliothèque snpar , qui utilise la syntaxe suivante :

runs.test(x, exact = FALSE, alternative = c(« two.side », « moins », « plus grand »))

où:

x : un vecteur numérique de valeurs de données.
exact : indique si une valeur p exacte doit être calculée. C’est FAUX par défaut. Si le nombre d’exécutions est assez petit, vous pouvez le remplacer par TRUE.
alternative : indique l’hypothèse alternative. La valeur par défaut est recto verso.

Le code suivant montre comment effectuer le test Run à l’aide de cette fonction dans R :

library(snpar)

#create dataset
data <- c(12, 16, 16, 15, 14, 18, 19, 21, 13, 13)

#perform Run's test
runs.test(data)

	Approximate runs rest

data:  data
Runs = 5, p-value = 0.5023
alternative hypothesis: two.sided

La valeur p du test est de 0,5023 . Puisque ce n’est pas inférieur à α = 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle. Nous disposons de suffisamment de preuves pour affirmer que les données ont été produites de manière aléatoire.

Méthode 2 : exécuter le test à l’aide de la bibliothèque randtests

La deuxième façon d’effectuer le test de Run consiste à utiliser la fonction runs.test() de la bibliothèque randtests , qui utilise la syntaxe suivante :

runs.test(x, alternative = c(« deux côtés », « moins », « plus grand »))

où:

x : un vecteur numérique de valeurs de données.
alternative : indique l’hypothèse alternative. La valeur par défaut est recto verso.

Le code suivant montre comment effectuer le test Run à l’aide de cette fonction dans R :

library(randtests)

#create dataset
data <- c(12, 16, 16, 15, 14, 18, 19, 21, 13, 13)

#perform Run's test
runs.test(data)

	Runs Test

data:  data
statistic = -0.67082, runs = 5, n1 = 5, n2 = 5, n = 10, p-value =
0.5023
alternative hypothesis: nonrandomness

Encore une fois, la valeur p du test est de 0,5023 . Puisque ce n’est pas inférieur à α = 0,05, nous ne parvenons pas à rejeter l’hypothèse nulle. Nous disposons de suffisamment de preuves pour affirmer que les données ont été produites de manière aléatoire.

à propos de l'auteur

Dr. Benjamin Anderson

Il est un professeur de statistiques à la retraite devenu éducateur dévoué sur Statorials. Avec une vaste expérience et une expertise dans le domaine des statistiques, je m'engage à partager mes connaissances pour responsabiliser les étudiants grâce à Statorials. Lire plus