Variantieverhoudingstest uitvoeren in r (met voorbeeld)
Een variantie-ratiotest wordt gebruikt om te testen of twee populatievarianties gelijk zijn of niet.
Deze test maakt gebruik van de volgende nul- en alternatieve hypothesen:
- H 0 : Populatievarianties zijn gelijk
- H A : Populatievarianties zijn niet gelijk
Om deze test uit te voeren, berekenen we de volgende teststatistiek:
F = s 1 2 / s 2 2
Goud:
- s 1 2 : De steekproefvariantie van de eerste groep
- s 2 2 : De steekproefvariantie van de tweede groep
Als de p-waarde die overeenkomt met deze F-toetsstatistiek onder een bepaalde drempel ligt (bijvoorbeeld 0,05), dan verwerpen we de nulhypothese en concluderen we dat de populatievarianties niet gelijk zijn.
Om een variantieverhoudingstest in R uit te voeren, kunnen we de ingebouwde functie var.test() gebruiken.
Het volgende voorbeeld laat zien hoe u deze functie in de praktijk kunt gebruiken.
Voorbeeld: testen van de variantieverhouding in R
Stel dat we willen weten of twee verschillende plantensoorten dezelfde hoogtevariatie hebben.
Om dit te testen, verzamelen we een eenvoudig willekeurig monster van 15 planten van elke soort.
De volgende code laat zien hoe u een variantieverhoudingstest in R uitvoert om te bepalen of de hoogtevariantie gelijk is tussen de twee soorten:
#create vectors to hold plant heights from each sample group1 <- c(5, 6, 6, 8, 10, 12, 12, 13, 14, 15, 15, 17, 18, 18, 19) group2 <- c(9, 9, 10, 12, 12, 13, 14, 16, 16, 19, 22, 24, 26, 29, 29) #perform variance ratio test var. test (group1, group2) F test to compare two variances data: group1 and group2 F = 0.43718, num df = 14, denom df = 14, p-value = 0.1336 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.1467737 1.3021737 sample estimates: ratio of variances 0.4371783
Zo interpreteert u de testresultaten:
data: de namen van de vectoren die de voorbeeldgegevens bevatten.
F: De F-teststatistiek. In dit geval is dit 0,43718 .
num df, denom df : De vrijheidsgraden van de teller en de noemer voor de F-toetsstatistiek, berekend als respectievelijk n 1 – 1 en n 2 -1.
p-waarde: De p-waarde die overeenkomt met de F-toetsstatistiek van 0,43718 met teller df = 14 en noemer df = 14. De p-waarde blijkt 0,1336 te zijn.
95% betrouwbaarheidsinterval: 95% betrouwbaarheidsinterval voor de werkelijke verhouding van varianties tussen de twee groepen. Het blijkt [.147, 1.302] te zijn. Omdat dit interval 1 bevat, is het aannemelijk dat de werkelijke verhouding van varianties 1 is, dat wil zeggen gelijke varianties.
steekproefschattingen: dit vertegenwoordigt de verhouding van de varianties tussen elke groep. Als we de functie var() gebruiken, kunnen we zien dat de steekproefvariantie van de eerste groep 21,8381 is en de steekproefvariantie van de tweede groep 49,95238. De variantieverhouding is dus 21,8381 / 49,95238 = 0,4371783 .
Laten we ons de nul- en alternatieve hypothesen van deze test herinneren:
- H 0 : Populatievarianties zijn gelijk
- H A : Populatievarianties zijn niet gelijk
Omdat de p-waarde van onze test (0,1336) niet minder dan 0,05 bedraagt, slagen we er niet in de nulhypothese te verwerpen.
Dit betekent dat we niet voldoende bewijs hebben om te concluderen dat de variantie in planthoogte tussen de twee soorten ongelijk is.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:
Hoe u een T-test met één monster uitvoert in R
Hoe de T-test van Welch uit te voeren in R
Hoe voer je een paired samples t-test uit in R