Runtimetests uitvoeren in r
Runtesten zijn een statistische test die wordt gebruikt om te bepalen of een dataset al dan niet afkomstig is van een willekeurig proces.
De nul- en alternatieve hypothesen van de test zijn als volgt:
H 0 (nul): de gegevens zijn willekeurig geproduceerd.
H a (alternatief): De gegevens zijn niet willekeurig gegenereerd.
In deze tutorial worden twee methoden uitgelegd die u kunt gebruiken om testruns uit te voeren in R. Houd er rekening mee dat beide methoden tot dezelfde testresultaten leiden.
Methode 1: Voer de test uit met behulp van de snpar- bibliotheek
De eerste manier om de Run-test uit te voeren is door de functie runs.test() uit de snpar- bibliotheek te gebruiken, die de volgende syntaxis gebruikt:
runs.test(x, exact = ONWAAR, alternatief = c(“tweezijdig”, “minder”, “groter”))
Goud:
- x: een numerieke vector van gegevenswaarden.
- exact: Geeft aan of er een exacte p-waarde moet worden berekend. Dit is standaard FALSE. Als het aantal uitvoeringen klein genoeg is, kunt u dit wijzigen in TRUE.
- alternatief: geeft de alternatieve hypothese aan. De standaardinstelling is dubbelzijdig.
De volgende code laat zien hoe u de Run-test uitvoert met deze functie in R:
library(snpar) #create dataset data <- c(12, 16, 16, 15, 14, 18, 19, 21, 13, 13) #perform Run's test runs.test(data) Approximate runs rest data:data Runs = 5, p-value = 0.5023 alternative hypothesis: two.sided
De p-waarde van de test is 0,5023 . Omdat dit niet minder is dan α = 0,05, slagen we er niet in de nulhypothese te verwerpen. We hebben genoeg bewijs om te zeggen dat de gegevens willekeurig zijn gegenereerd.
Methode 2: Voer de test uit met behulp van de randtests- bibliotheek
De tweede manier om de Run-test uit te voeren is door de functie runs.test() uit de bibliotheek randtests te gebruiken, die de volgende syntaxis gebruikt:
runs.test(x, alternatief = c(“beide kanten”, “minder”, “groter”))
Goud:
- x: een numerieke vector van gegevenswaarden.
- alternatief: geeft de alternatieve hypothese aan. De standaardinstelling is dubbelzijdig.
De volgende code laat zien hoe u de Run-test uitvoert met deze functie in R:
library(randtests) #create dataset data <- c(12, 16, 16, 15, 14, 18, 19, 21, 13, 13) #perform Run's test runs.test(data) Test Runs data:data statistic = -0.67082, runs = 5, n1 = 5, n2 = 5, n = 10, p-value = 0.5023 alternative hypothesis: nonrandomness
Opnieuw is de p-waarde voor de test 0,5023 . Omdat dit niet minder is dan α = 0,05, slagen we er niet in de nulhypothese te verwerpen. We hebben genoeg bewijs om te zeggen dat de gegevens willekeurig zijn gegenereerd.