Jak przeprowadzić testy wykonawcze w r
Testowanie uruchomieniowe to test statystyczny używany do określenia, czy zestaw danych pochodzi z procesu losowego.
Hipotezy zerowe i alternatywne testu są następujące:
H 0 (null): dane wygenerowano losowo.
H a (alternatywa): Dane nie zostały wygenerowane losowo.
W tym samouczku wyjaśniono dwie metody, których można użyć do przeprowadzenia testów w języku R. Należy pamiętać, że obie metody prowadzą do tych samych wyników testów.
Metoda 1: Uruchom test przy użyciu biblioteki snpar
Pierwszym sposobem wykonania testu Uruchom jest użycie funkcji runs.test() z biblioteki snpar , która wykorzystuje następującą składnię:
run.test(x, dokładne = FAŁSZ, alternatywa = c(„dwie.strony”, „mniej”, „większe”))
Złoto:
- x: wektor numeryczny wartości danych.
- dokładne: Wskazuje, czy należy obliczyć dokładną wartość p. Domyślnie jest to FAŁSZ. Jeśli liczba wykonań jest wystarczająco mała, możesz zmienić ją na TRUE.
- alternatywa: wskazuje alternatywną hipotezę. Domyślnie jest dwustronny.
Poniższy kod pokazuje, jak wykonać test Run przy użyciu tej funkcji w R:
library(snpar) #create dataset data <- c(12, 16, 16, 15, 14, 18, 19, 21, 13, 13) #perform Run's test runs.test(data) Approximate runs rest data:data Runs = 5, p-value = 0.5023 alternative hypothesis: two.sided
Wartość p testu wynosi 0,5023 . Ponieważ jest to nie mniej niż α = 0,05, nie możemy odrzucić hipotezy zerowej. Mamy wystarczające dowody, aby stwierdzić, że dane zostały wygenerowane losowo.
Metoda 2: Uruchom test przy użyciu biblioteki randtests
Drugim sposobem wykonania testu Run jest użycie funkcji runs.test() z biblioteki randtests , która wykorzystuje następującą składnię:
runs.test(x, alternatywa = c(„obie strony”, „mniej”, „większy”))
Złoto:
- x: wektor numeryczny wartości danych.
- alternatywa: wskazuje alternatywną hipotezę. Domyślnie jest dwustronny.
Poniższy kod pokazuje, jak wykonać test Run przy użyciu tej funkcji w R:
library(randtests) #create dataset data <- c(12, 16, 16, 15, 14, 18, 19, 21, 13, 13) #perform Run's test runs.test(data) Test Runs data:data statistic = -0.67082, runs = 5, n1 = 5, n2 = 5, n = 10, p-value = 0.5023 alternative hypothesis: nonrandomness
Ponownie, wartość p dla testu wynosi 0,5023 . Ponieważ jest to nie mniej niż α = 0,05, nie możemy odrzucić hipotezy zerowej. Mamy wystarczające dowody, aby stwierdzić, że dane zostały wygenerowane losowo.