Teste t de welch: quando usar + exemplos
Quando queremos comparar as médias de dois grupos independentes, podemos escolher entre usar dois testes diferentes:
Teste t de Student: Este teste pressupõe que os dois grupos de dados são amostrados de populações que seguem uma distribuição normal e que as duas populações têm a mesma variância.
Teste t de Welch: Este teste pressupõe que ambos os grupos de dados são amostrados de populações que seguem uma distribuição normal, mas não pressupõe que essas duas populações tenham a mesma variância .
A diferença entre o teste t de Student e o teste t de Welch
Existem duas diferenças na forma como o teste t de Student e o teste t de Welch são realizados:
- A estatística de teste
- Graus de liberdade
Teste t de estudante:
Estatística de teste: ( x 1 – x 2 ) / s p (√ 1/n 1 + 1/n 2 )
onde x 1 e x 2 são as médias amostrais, n 1 e n 2 são os tamanhos amostrais para a amostra 1 e amostra 2, respectivamente, e onde s p é calculado da seguinte forma:
s p = √ (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)
onde s 1 2 e s 2 2 são as variâncias da amostra.
Graus de liberdade: n 1 + n 2 – 2
Teste T de Welch
Estatística de teste: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Graus de liberdade: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
A fórmula de cálculo dos graus de liberdade do teste t de Welch leva em consideração a diferença entre os dois desvios padrão. Se as duas amostras tiverem os mesmos desvios padrão, então os graus de liberdade do teste t de Welch serão exatamente iguais aos graus de liberdade do teste t de Student.
Normalmente, os desvios padrão para as duas amostras não são iguais e, portanto, os graus de liberdade do teste t de Welch tendem a ser menores que os graus de liberdade do teste t de Student.
Também é importante notar que os graus de liberdade no teste t de Welch geralmente não são um número inteiro. Se você estiver testando manualmente, é melhor arredondar para o número inteiro mais baixo. Se você usar um software estatístico como R , o software será capaz de fornecer o valor decimal dos graus de liberdade.
Quando você deve usar o teste t de Welch?
Algumas pessoas argumentam que o teste t de Welch deveria ser a escolha padrão para comparar as médias de dois grupos independentes porque tem um desempenho melhor do que o teste t de Student quando os tamanhos das amostras e as variâncias são desiguais entre os grupos, e fornece resultados idênticos quando os tamanhos das amostras são diferentes. as diferenças são iguais.
Na prática, quando comparamos as médias de dois grupos, é improvável que os desvios padrão de cada grupo sejam iguais. Portanto, é uma boa ideia usar sempre o teste t de Welch, para que você não precise fazer suposições sobre igualdade de variâncias.
Exemplos de uso do teste t de Welch
A seguir, realizaremos o teste t de Welch nas duas amostras a seguir para determinar se suas médias populacionais diferem significativamente em um nível de significância de 0,05:
Amostra 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25
Amostra 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34
Ilustraremos como realizar o teste de três maneiras diferentes:
- Pela mão
- Utilize o Microsoft Excel
- Use a linguagem de programação estatística R
Teste T de Welch manualmente
Para realizar o teste t de Welch manualmente, primeiro precisamos encontrar as médias amostrais, as variâncias amostrais e os tamanhos amostrais:
x1 – 19,27
x2 – 23,69
s 1 2 – 20h42
arte 2 2 – 83,23
# 1 – 11
# 2 – 13
Então podemos inserir estes números para encontrar a estatística de teste:
Estatística de teste: ( x 1 – x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )
Estatística de teste: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538
Graus de liberdade: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }
Graus de liberdade: (20,42/11 + 83,23/13) 2 / { [ (20,42/11) 2 / (11 – 1) ] + [ (83,23/13) 2 / (13 – 1) ] } = 18,137. Arredondamos esse resultado para o número inteiro mais próximo, 18 .
Finalmente, encontraremos o valor crítico t na tabela de distribuição t que corresponde a um teste bilateral com alfa = 0,05 para 18 graus de liberdade:
O valor crítico t é 2,101 . Como o valor absoluto da nossa estatística de teste (1,538) não é maior que o valor crítico t, não conseguimos rejeitar a hipótese nula do teste. Não há evidências suficientes para afirmar que as médias das duas populações sejam significativamente diferentes.
Teste T de Welch com Excel
Para realizar o teste t de Welch no Excel, primeiro precisamos baixar o software gratuito Analysis ToolPak. Se você ainda não baixou no Excel, escrevi um tutorial rápido sobre como fazer o download .
Depois de fazer download do Analysis ToolPak, você pode seguir as etapas abaixo para realizar o teste t de Welch em nossas duas amostras:
1. Insira os dados. Insira os valores dos dados para as duas amostras nas colunas A e B e os títulos Amostra 1 e Amostra 2 na primeira célula de cada coluna.
2. Execute o teste t de Welch usando o Analysis ToolPak. Vá para a guia Dados na faixa superior. Em seguida, no grupo Análise , clique no ícone Analysis ToolPak.
Na caixa de diálogo exibida, clique em teste t: duas amostras assumindo variações desiguais e clique em OK.
Por fim, preencha os valores abaixo e clique em OK:
O seguinte resultado deverá aparecer:
Observe que os resultados deste teste correspondem aos resultados que obtivemos manualmente:
- A estatística de teste é -1,5379 .
- O valor crítico bilateral é 2.1009 .
- Como o valor absoluto da estatística de teste não é maior que o valor crítico bicaudal, as médias das duas populações não são estatisticamente diferentes.
- Além disso, o valor p bicaudal do teste é 0,14, que é maior que 0,05 e confirma que as médias das duas populações não são estatisticamente diferentes.
Teste t de Welch usando R
O código a seguir ilustra como realizar o teste t de Welch para nossas duas amostras usando a linguagem de programação estatística R :
#create two vectors to hold sample data values sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25) sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34) #conduct Welch's test t.test( sample1, sample2) # Welch Two Sample t-test # #data: sample1 and sample2 #t = -1.5379, df = 18.137, p-value = 0.1413 #alternative hypothesis: true difference in means is not equal to 0 #95 percent confidence interval: #-10.453875 1.614714 #sample estimates: #mean of x mean of y #19.27273 23.69231 #
A função t.test() exibe a seguinte saída relevante:
- t: a estatística de teste = -1,5379
- df : graus de liberdade = 18,137
- Valor p: o valor p do teste bicaudal = 0,1413
- Intervalo de confiança de 95% : o intervalo de confiança de 95% para a verdadeira diferença nas médias populacionais = (-10,45, 1,61)
Os resultados deste teste correspondem aos obtidos manualmente e em Excel: a diferença de médias para estas duas populações não é estatisticamente significativa ao nível de alfa = 0,05.