Jak wykonać test współczynnika wariancji w r (z przykładem)
Test współczynnika wariancji służy do sprawdzenia, czy dwie wariancje populacji są równe, czy nie.
W teście tym wykorzystuje się następujące hipotezy zerowe i alternatywne:
- H 0 : Wariancje populacji są równe
- H A : Wariancje populacji nie są równe
Aby wykonać ten test, obliczamy następującą statystykę testową:
F = s 1 2 / s 2 2
Złoto:
- s 1 2 : Wariancja próbki pierwszej grupy
- s 2 2 : Wariancja próbki drugiej grupy
Jeśli wartość p odpowiadająca tej statystyce testu F jest poniżej pewnego progu (np. 0,05), wówczas odrzucamy hipotezę zerową i stwierdzamy, że wariancje populacji nie są równe.
Aby wykonać test współczynnika wariancji w R, możemy skorzystać z wbudowanej funkcji var.test() .
Poniższy przykład pokazuje, jak w praktyce wykorzystać tę funkcję.
Przykład: testowanie współczynnika wariancji w R
Załóżmy, że chcemy wiedzieć, czy dwa różne gatunki roślin mają taką samą różnicę w wysokości.
Aby to przetestować, zbieramy prostą losową próbkę 15 roślin z każdego gatunku.
Poniższy kod pokazuje, jak wykonać test współczynnika wariancji w R, aby określić, czy wariancja wzrostu jest równa między dwoma gatunkami:
#create vectors to hold plant heights from each sample group1 <- c(5, 6, 6, 8, 10, 12, 12, 13, 14, 15, 15, 17, 18, 18, 19) group2 <- c(9, 9, 10, 12, 12, 13, 14, 16, 16, 19, 22, 24, 26, 29, 29) #perform variance ratio test var. test (group1, group2) F test to compare two variances data: group1 and group2 F = 0.43718, num df = 14, denom df = 14, p-value = 0.1336 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.1467737 1.3021737 sample estimates: ratio of variances 0.4371783
Oto jak interpretować wyniki testu:
dane: nazwy wektorów zawierających przykładowe dane.
F: Statystyka testu F. W tym przypadku jest to 0,43718 .
num df, denom df : Licznik i mianownik stopni swobody statystyki testowej F, obliczone odpowiednio jako n 1 – 1 i n 2 -1.
Wartość p: Wartość p odpowiadająca statystyce testu F wynoszącej 0,43718 z licznikiem df = 14 i mianownikiem df = 14. Wartość p wynosi 0,1336 .
95% przedział ufności: 95% przedział ufności dla prawdziwego stosunku wariancji pomiędzy obiema grupami. Okazuje się, że jest to [0,147, 1,302] . Ponieważ w tym przedziale zawarta jest liczba 1, prawdopodobne jest, że prawdziwy stosunek wariancji wynosi 1, tj. wariancje są równe.
szacunki próbek: przedstawiają stosunek wariancji pomiędzy każdą grupą. Jeśli użyjemy funkcji var() , zobaczymy, że wariancja próbki w pierwszej grupie wynosi 21,8381, a wariancja próbki w drugiej grupie wynosi 49,95238. Zatem stosunek wariancji wynosi 21,8381 / 49,95238 = 0,4371783 .
Przypomnijmy hipotezę zerową i alternatywną tego testu:
- H 0 : Wariancje populacji są równe
- H A : Wariancje populacji nie są równe
Ponieważ wartość p naszego testu (0,1336) jest nie mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej.
Oznacza to, że nie mamy wystarczających dowodów, aby stwierdzić, że różnice w wysokości roślin między obydwoma gatunkami są nierówne.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:
Jak wykonać test T dla jednej próby w R
Jak wykonać test T Welcha w R
Jak wykonać test t dla sparowanych próbek w R