Como realizar um teste t de duas amostras em r
Um teste t de duas amostras é usado para testar se as médias de duas populações são iguais ou não.
Você pode usar a seguinte sintaxe básica para realizar um teste t de dois exemplos em R:
t. test (group1, group2, var. equal = TRUE )
Nota : Ao especificar var.equal=TRUE , estamos dizendo a R para assumir que as variações são iguais entre as duas amostras.
Se você não quiser fazer essa suposição, deixe esse argumento de lado e R executará o teste t de Welch , que não pressupõe que as variâncias sejam iguais entre as amostras.
O exemplo a seguir mostra como realizar um teste t de duas amostras em R na prática.
Exemplo: teste T de duas amostras em R
Suponha que queiramos saber se duas espécies diferentes de plantas têm a mesma altura média.
Para testar isso, coletamos uma amostra aleatória simples de 12 plantas de cada espécie.
O código a seguir mostra como realizar um teste t de duas amostras em R para determinar se a altura média é igual entre as duas espécies:
#create vectors to hold plant heights from each sample group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19) group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19) #perform two sample t-tests t. test (group1, group2, var. equal = TRUE ) Two Sample t-test data: group1 and group2 t = -2.5505, df = 22, p-value = 0.01823 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.5904820 -0.5761847 sample estimates: mean of x mean of y 11.66667 14.75000
Veja como interpretar os resultados do teste:
dados: os nomes dos vetores que contêm os dados de amostra.
t: A estatística do teste t. Neste caso é -2.5505 .
df : Os graus de liberdade, calculados como n 1 + n 2 – 2 = 12 + 12 – 2 = 22 .
Valor p: O valor p que corresponde a uma estatística de teste de -2,5505 e df = 22. O valor p acaba sendo .01823 . Podemos confirmar esse valor usando a calculadora T Score para P Value .
Intervalo de confiança de 95%: intervalo de confiança de 95% para a verdadeira diferença nas médias entre os dois grupos. Acontece que é [-5.59, -.576] .
estimativas amostrais: a média amostral de cada grupo. Neste caso, a média amostral do Grupo 1 foi 11,667 e a média amostral do Grupo 2 foi 14,75 .
As hipóteses nula e alternativa para este teste t de duas amostras específico são as seguintes:
H 0 : µ 1 = µ 2 (as duas médias populacionais são iguais)
HA : µ 1 ≠µ 2 (as duas médias populacionais não são iguais)
Sendo o valor p do nosso teste (0,01823) inferior a 0,05, rejeitamos a hipótese nula.
Isto significa que temos evidências suficientes para concluir que a altura média das plantas entre as duas espécies não é igual.
Notas técnicas
A função t.test() em R usa a seguinte sintaxe:
t. test (x, y, alternative="two.sided", mu=0, paired=FALSE, var.equal=FALSE, conf.level=0.95)
Ouro:
- x, y: os nomes dos dois vetores que contêm os dados.
- alternativa: A hipótese alternativa. As opções incluem “frente e verso”, “menos” ou “maior”.
- mu: O valor assumido como a verdadeira diferença das médias.
- pareado: se deve ou não usar um teste t pareado.
- var.equal: se as diferenças são iguais ou não entre os dois grupos.
- conf.level: O nível de confiança a ser usado para o teste.
Sinta-se à vontade para modificar qualquer um desses argumentos ao realizar seu próprio teste t, dependendo do teste específico que deseja realizar.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:
Como realizar um teste T de uma amostra em R
Como realizar o teste T de Welch em R
Como realizar um teste t de amostras pareadas em R