Runtimetests uitvoeren in r


Runtesten zijn een statistische test die wordt gebruikt om te bepalen of een dataset al dan niet afkomstig is van een willekeurig proces.

De nul- en alternatieve hypothesen van de test zijn als volgt:

H 0 (nul): de gegevens zijn willekeurig geproduceerd.

H a (alternatief): De gegevens zijn niet willekeurig gegenereerd.

In deze tutorial worden twee methoden uitgelegd die u kunt gebruiken om testruns uit te voeren in R. Houd er rekening mee dat beide methoden tot dezelfde testresultaten leiden.

Methode 1: Voer de test uit met behulp van de snpar- bibliotheek

De eerste manier om de Run-test uit te voeren is door de functie runs.test() uit de snpar- bibliotheek te gebruiken, die de volgende syntaxis gebruikt:

runs.test(x, exact = ONWAAR, alternatief = c(“tweezijdig”, “minder”, “groter”))

Goud:

  • x: een numerieke vector van gegevenswaarden.
  • exact: Geeft aan of er een exacte p-waarde moet worden berekend. Dit is standaard FALSE. Als het aantal uitvoeringen klein genoeg is, kunt u dit wijzigen in TRUE.
  • alternatief: geeft de alternatieve hypothese aan. De standaardinstelling is dubbelzijdig.

De volgende code laat zien hoe u de Run-test uitvoert met deze functie in R:

 library(snpar)

#create dataset
data <- c(12, 16, 16, 15, 14, 18, 19, 21, 13, 13)

#perform Run's test
runs.test(data)

	Approximate runs rest

data:data
Runs = 5, p-value = 0.5023
alternative hypothesis: two.sided

De p-waarde van de test is 0,5023 . Omdat dit niet minder is dan α = 0,05, slagen we er niet in de nulhypothese te verwerpen. We hebben genoeg bewijs om te zeggen dat de gegevens willekeurig zijn gegenereerd.

Methode 2: Voer de test uit met behulp van de randtests- bibliotheek

De tweede manier om de Run-test uit te voeren is door de functie runs.test() uit de bibliotheek randtests te gebruiken, die de volgende syntaxis gebruikt:

runs.test(x, alternatief = c(“beide kanten”, “minder”, “groter”))

Goud:

  • x: een numerieke vector van gegevenswaarden.
  • alternatief: geeft de alternatieve hypothese aan. De standaardinstelling is dubbelzijdig.

De volgende code laat zien hoe u de Run-test uitvoert met deze functie in R:

 library(randtests)

#create dataset
data <- c(12, 16, 16, 15, 14, 18, 19, 21, 13, 13)

#perform Run's test
runs.test(data)

	Test Runs

data:data
statistic = -0.67082, runs = 5, n1 = 5, n2 = 5, n = 10, p-value =
0.5023
alternative hypothesis: nonrandomness

Opnieuw is de p-waarde voor de test 0,5023 . Omdat dit niet minder is dan α = 0,05, slagen we er niet in de nulhypothese te verwerpen. We hebben genoeg bewijs om te zeggen dat de gegevens willekeurig zijn gegenereerd.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert