Como realizar o teste de razão de variância em r (com exemplo)


Um teste de razão de variância é usado para testar se duas variâncias populacionais são iguais ou não.

Este teste usa as seguintes hipóteses nulas e alternativas:

  • H 0 : As variâncias populacionais são iguais
  • HA : As variações populacionais não são iguais

Para realizar este teste, calculamos a seguinte estatística de teste:

F =s 1 2 /s 2 2

Ouro:

  • s 1 2 : A variância amostral do primeiro grupo
  • s 2 2 : A variância amostral do segundo grupo

Se o valor p que corresponde a esta estatística do teste F estiver abaixo de um determinado limite (por exemplo, 0,05), então rejeitamos a hipótese nula e concluímos que as variâncias populacionais não são iguais.

Para realizar um teste de razão de variância em R, podemos usar a função integrada var.test() .

O exemplo a seguir mostra como usar esta função na prática.

Exemplo: Testando a Razão de Variância em R

Suponha que queiramos saber se duas espécies de plantas diferentes têm a mesma variação de altura.

Para testar isso, coletamos uma amostra aleatória simples de 15 plantas de cada espécie.

O código a seguir mostra como realizar um teste de razão de variância em R para determinar se a variância de altura é igual entre as duas espécies:

 #create vectors to hold plant heights from each sample
group1 <- c(5, 6, 6, 8, 10, 12, 12, 13, 14, 15, 15, 17, 18, 18, 19)
group2 <- c(9, 9, 10, 12, 12, 13, 14, 16, 16, 19, 22, 24, 26, 29, 29)

#perform variance ratio test
var. test (group1, group2)

	F test to compare two variances

data: group1 and group2
F = 0.43718, num df = 14, denom df = 14, p-value = 0.1336
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.1467737 1.3021737
sample estimates:
ratio of variances 
         0.4371783

Veja como interpretar os resultados do teste:

dados: os nomes dos vetores que contêm os dados de amostra.

F: A estatística do teste F. Neste caso é 0,43718 .

num df, denom df : Os graus de liberdade do numerador e do denominador para a estatística do teste F, calculados como n 1 – 1 e n 2 -1, respectivamente.

Valor p: O valor p que corresponde à estatística do teste F de 0,43718 com numerador df = 14 e denominador df = 14. O valor p acaba sendo 0,1336 .

Intervalo de confiança de 95%: intervalo de confiança de 95% para a verdadeira razão de variâncias entre os dois grupos. Acontece que é [.147, 1.302] . Como 1 está contido neste intervalo, é plausível que a verdadeira razão de variâncias seja 1, ou seja, variâncias iguais.

estimativas amostrais: representa a proporção de variâncias entre cada grupo. Se usarmos a função var() , podemos ver que a variância amostral do primeiro grupo é 21,8381 e a variância amostral do segundo grupo é 49,95238. Portanto, a proporção das variâncias é 21,8381 / 49,95238 = 0,4371783 .

Recordemos as hipóteses nula e alternativa deste teste:

  • H 0 : As variâncias populacionais são iguais
  • HA : As variações populacionais não são iguais

Como o valor p do nosso teste (0,1336) não é inferior a 0,05, não rejeitamos a hipótese nula.

Isto significa que não temos evidências suficientes para concluir que a variação na altura das plantas entre as duas espécies é desigual.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:

Como realizar um teste T de uma amostra em R
Como realizar o teste T de Welch em R
Como realizar um teste t de amostras pareadas em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *