Qual é a diferença entre um teste t e uma anova?
Este tutorial explica a diferença entre um teste t e uma ANOVA , bem como quando usar cada teste.
Teste T
Um teste t é usado para determinar se há ou não uma diferença estatisticamente significativa entre as médias de dois grupos . Existem dois tipos de testes t:
1. Teste t de amostras independentes. Isto é usado quando queremos comparar a diferença entre as médias de dois grupos e os grupos são completamente independentes um do outro.
Por exemplo, os pesquisadores podem querer saber se a Dieta A ou a Dieta B ajudam as pessoas a perder mais peso. 100 pessoas designadas aleatoriamente são designadas para a dieta A. Outras 100 pessoas designadas aleatoriamente são designadas para a dieta B. Após três meses, os pesquisadores registram a perda de peso total de cada pessoa. Para determinar se a perda média de peso entre os dois grupos é significativamente diferente, os pesquisadores podem realizar um teste t de amostras independentes.
2. Teste t de amostras pareadas . Isto é usado quando queremos comparar a diferença entre as médias de dois grupos e onde cada observação de um grupo pode ser associada a uma observação do outro grupo.
Por exemplo, digamos que 20 alunos de uma turma façam um teste, depois estudem um determinado guia e depois façam o teste novamente. Para comparar a diferença entre as pontuações do primeiro e do segundo teste, usamos um teste t pareado porque, para cada aluno, a pontuação do primeiro teste pode ser associada à pontuação do segundo teste.
Para que um teste t produza resultados válidos, as seguintes suposições devem ser atendidas:
- Aleatório: Uma amostra aleatória ou experimento aleatório deve ser usado para coletar dados para ambas as amostras.
- Normal: A distribuição amostral é normal ou aproximadamente normal.
Se essas suposições forem atendidas, é possível usar um teste t para testar a diferença entre as médias de dois grupos.
ANOVA
Uma ANOVA (análise de variância) é usada para determinar se existe ou não uma diferença estatisticamente significativa entre as médias de três ou mais grupos . Os testes ANOVA mais comumente usados na prática são ANOVA unidirecional e ANOVA bidirecional:
ANOVA unidirecional: usada para testar se há ou não uma diferença estatisticamente significativa entre as médias de três ou mais grupos quando os grupos podem ser divididos em um único fator .
Exemplo: Você divide aleatoriamente uma turma de 90 alunos em três grupos de 30. Cada grupo usa uma técnica de estudo diferente durante um mês para se preparar para um exame. No final do mês, todos os alunos fazem o mesmo exame. Você quer saber se a técnica de estudo tem ou não impacto nas notas dos exames. Portanto, você realiza uma ANOVA unidirecional para determinar se há uma diferença estatisticamente significativa entre as pontuações médias dos três grupos.
ANOVA bidirecional: usada para testar se há ou não diferença estatisticamente significativa entre as médias de três ou mais grupos quando os grupos podem ser divididos em dois fatores .
Exemplo: você deseja determinar se o nível de exercício (nenhum exercício, exercício leve, exercício vigoroso) e o gênero (masculino, feminino) impactam a perda de peso. Neste caso, os dois fatores que você está estudando são exercício e gênero e sua variável de resposta é a perda de peso (medida em libras). Você pode realizar uma ANOVA bidirecional para determinar se o exercício e o gênero impactam a perda de peso e para determinar se há uma interação entre o exercício e o gênero na perda de peso.
Para que uma ANOVA produza resultados válidos, as seguintes suposições devem ser atendidas:
- Normalidade – todas as populações que estudamos seguem uma distribuição normal. Assim, por exemplo, se quisermos comparar as notas dos exames de três grupos diferentes de alunos, as notas dos exames do primeiro grupo, do segundo grupo e do terceiro grupo devem ser todas distribuídas normalmente.
- Variância igual – as variações populacionais em cada grupo são iguais ou aproximadamente iguais.
- Independência – as observações de cada grupo devem ser independentes umas das outras. Normalmente, um desenho aleatório cuida disso.
Se estes pressupostos forem cumpridos, então é possível utilizar uma ANOVA para testar a diferença entre as médias de três ou mais grupos.
Entenda as diferenças entre cada teste
A principal diferença entre um teste t e uma ANOVA é como ambos os testes calculam sua estatística de teste para determinar se há uma diferença estatisticamente significativa entre os grupos.
Um teste t de amostras independentes usa a seguinte estatística de teste:
estatística de teste t = [ ( x 1 – x 2 ) – d ] / (√ s 2 1 / n 1 + s 2 2 / n 2 )
onde x 1 ex 2 são as médias amostrais para os grupos 1 e 2, d é a diferença hipotética entre as duas médias (geralmente é zero), s 1 2 e s 2 2 são as variâncias amostrais para os grupos 1 e 2, e n 1 e n 2 são os tamanhos amostrais para os grupos 1 e 2, respectivamente.
Um teste t de amostras pareadas usa a seguinte estatística de teste:
estatística de teste t = d / (s d / √n)
onde d é a diferença média entre os dois grupos, s d é o desvio padrão das diferenças e n é o tamanho da amostra para cada grupo (observe que ambos os grupos terão o mesmo tamanho de amostra).
Uma ANOVA usa a seguinte estatística de teste:
estatística de teste F = s 2 b / s 2 w
onde s 2 b é a variância entre amostras e s 2 w é a variância dentro da amostra.
Um teste t mede a razão entre a diferença média entre dois grupos e o desvio padrão geral das diferenças. Se este rácio for suficientemente elevado, é evidência suficiente de que existe uma diferença significativa entre os dois grupos.
Uma ANOVA, por outro lado, mede a proporção da variância entre os grupos em comparação com a variância dentro dos grupos. Tal como o teste t, se este rácio for suficientemente elevado, fornece provas suficientes de que os três grupos não têm a mesma média.
Outra diferença importante entre um teste t e uma ANOVA é que o teste t pode nos dizer se dois grupos têm ou não a mesma média. Uma ANOVA, por outro lado, diz-nos se três grupos têm todos a mesma média, mas não nos diz explicitamente quais grupos têm médias diferentes uns dos outros.
Para descobrir quais grupos diferem entre si, seriam necessários testes post hoc .
Entenda quando usar cada teste
Na prática, quando queremos comparar as médias de dois grupos , usamos um teste t. Quando queremos comparar as médias de três ou mais grupos , usamos uma ANOVA.
A razão subjacente pela qual não usamos simplesmente vários testes t para comparar as médias de três ou mais grupos remonta à compreensão da taxa de erro Tipo I. Suponha que queiramos comparar as médias de três grupos: o grupo A, o grupo B e o grupo C. Você pode ficar tentado a realizar os três testes t a seguir:
- Um teste t para comparar a diferença de médias entre o grupo A e o grupo B
- Um teste t para comparar a diferença de médias entre o grupo A e o grupo C
- Um teste t para comparar a diferença de médias entre o grupo B e o grupo C
Para cada teste t, há uma chance de cometermos um erro Tipo I , que é a probabilidade de rejeitarmos a hipótese nula quando ela for realmente verdadeira. Essa probabilidade é geralmente de 5%. Isso significa que quando realizamos vários testes t, essa taxa de erro aumenta. Por exemplo:
- A probabilidade de cometermos um erro Tipo I com um único teste t é 1 – 0,95 = 0,05 .
- A probabilidade de cometermos um erro Tipo I com dois testes t é 1 – (0,95 2 ) = 0,0975 .
- A probabilidade de cometermos um erro Tipo I com dois testes t é 1 – (0,95 3 ) = 0,1427 .
Esta taxa de erro é inaceitavelmente elevada. Felizmente, uma ANOVA controla esses erros, de modo que o erro Tipo I permanece em apenas 5%. Isso nos permite ter mais confiança de que um resultado de teste estatisticamente significativo é realmente significativo e não apenas um resultado obtido ao executar muitos testes.
Então, quando queremos entender se existe diferença entre as médias de três ou mais grupos, precisamos utilizar uma ANOVA para que nossos resultados sejam estatisticamente válidos e confiáveis.