Como realizar o teste de razão de variância em r (com exemplo)
Um teste de razão de variância é usado para testar se duas variâncias populacionais são iguais ou não.
Este teste usa as seguintes hipóteses nulas e alternativas:
- H 0 : As variâncias populacionais são iguais
- HA : As variações populacionais não são iguais
Para realizar este teste, calculamos a seguinte estatística de teste:
F =s 1 2 /s 2 2
Ouro:
- s 1 2 : A variância amostral do primeiro grupo
- s 2 2 : A variância amostral do segundo grupo
Se o valor p que corresponde a esta estatística do teste F estiver abaixo de um determinado limite (por exemplo, 0,05), então rejeitamos a hipótese nula e concluímos que as variâncias populacionais não são iguais.
Para realizar um teste de razão de variância em R, podemos usar a função integrada var.test() .
O exemplo a seguir mostra como usar esta função na prática.
Exemplo: Testando a Razão de Variância em R
Suponha que queiramos saber se duas espécies de plantas diferentes têm a mesma variação de altura.
Para testar isso, coletamos uma amostra aleatória simples de 15 plantas de cada espécie.
O código a seguir mostra como realizar um teste de razão de variância em R para determinar se a variância de altura é igual entre as duas espécies:
#create vectors to hold plant heights from each sample group1 <- c(5, 6, 6, 8, 10, 12, 12, 13, 14, 15, 15, 17, 18, 18, 19) group2 <- c(9, 9, 10, 12, 12, 13, 14, 16, 16, 19, 22, 24, 26, 29, 29) #perform variance ratio test var. test (group1, group2) F test to compare two variances data: group1 and group2 F = 0.43718, num df = 14, denom df = 14, p-value = 0.1336 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.1467737 1.3021737 sample estimates: ratio of variances 0.4371783
Veja como interpretar os resultados do teste:
dados: os nomes dos vetores que contêm os dados de amostra.
F: A estatística do teste F. Neste caso é 0,43718 .
num df, denom df : Os graus de liberdade do numerador e do denominador para a estatística do teste F, calculados como n 1 – 1 e n 2 -1, respectivamente.
Valor p: O valor p que corresponde à estatística do teste F de 0,43718 com numerador df = 14 e denominador df = 14. O valor p acaba sendo 0,1336 .
Intervalo de confiança de 95%: intervalo de confiança de 95% para a verdadeira razão de variâncias entre os dois grupos. Acontece que é [.147, 1.302] . Como 1 está contido neste intervalo, é plausível que a verdadeira razão de variâncias seja 1, ou seja, variâncias iguais.
estimativas amostrais: representa a proporção de variâncias entre cada grupo. Se usarmos a função var() , podemos ver que a variância amostral do primeiro grupo é 21,8381 e a variância amostral do segundo grupo é 49,95238. Portanto, a proporção das variâncias é 21,8381 / 49,95238 = 0,4371783 .
Recordemos as hipóteses nula e alternativa deste teste:
- H 0 : As variâncias populacionais são iguais
- HA : As variações populacionais não são iguais
Como o valor p do nosso teste (0,1336) não é inferior a 0,05, não rejeitamos a hipótese nula.
Isto significa que não temos evidências suficientes para concluir que a variação na altura das plantas entre as duas espécies é desigual.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:
Como realizar um teste T de uma amostra em R
Como realizar o teste T de Welch em R
Como realizar um teste t de amostras pareadas em R