Teste t de welch: quando usar + exemplos


Quando queremos comparar as médias de dois grupos independentes, podemos escolher entre usar dois testes diferentes:

Teste t de Student: Este teste pressupõe que os dois grupos de dados são amostrados de populações que seguem uma distribuição normal e que as duas populações têm a mesma variância.

Teste t de Welch: Este teste pressupõe que ambos os grupos de dados são amostrados de populações que seguem uma distribuição normal, mas não pressupõe que essas duas populações tenham a mesma variância .

A diferença entre o teste t de Student e o teste t de Welch

Existem duas diferenças na forma como o teste t de Student e o teste t de Welch são realizados:

  • A estatística de teste
  • Graus de liberdade

Teste t de estudante:

Estatística de teste: ( x 1x 2 ) / s p (√ 1/n 1 + 1/n 2 )

onde x 1 e x 2 são as médias amostrais, n 1 e n 2 são os tamanhos amostrais para a amostra 1 e amostra 2, respectivamente, e onde s p é calculado da seguinte forma:

s p = (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

onde s 1 2 e s 2 2 são as variâncias da amostra.

Graus de liberdade: n 1 + n 2 – 2

Teste T de Welch

Estatística de teste: ( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

Graus de liberdade: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }

A fórmula de cálculo dos graus de liberdade do teste t de Welch leva em consideração a diferença entre os dois desvios padrão. Se as duas amostras tiverem os mesmos desvios padrão, então os graus de liberdade do teste t de Welch serão exatamente iguais aos graus de liberdade do teste t de Student.

Normalmente, os desvios padrão para as duas amostras não são iguais e, portanto, os graus de liberdade do teste t de Welch tendem a ser menores que os graus de liberdade do teste t de Student.

Também é importante notar que os graus de liberdade no teste t de Welch geralmente não são um número inteiro. Se você estiver testando manualmente, é melhor arredondar para o número inteiro mais baixo. Se você usar um software estatístico como R , o software será capaz de fornecer o valor decimal dos graus de liberdade.

Quando você deve usar o teste t de Welch?

Algumas pessoas argumentam que o teste t de Welch deveria ser a escolha padrão para comparar as médias de dois grupos independentes porque tem um desempenho melhor do que o teste t de Student quando os tamanhos das amostras e as variâncias são desiguais entre os grupos, e fornece resultados idênticos quando os tamanhos das amostras são diferentes. as diferenças são iguais.

Na prática, quando comparamos as médias de dois grupos, é improvável que os desvios padrão de cada grupo sejam iguais. Portanto, é uma boa ideia usar sempre o teste t de Welch, para que você não precise fazer suposições sobre igualdade de variâncias.

Exemplos de uso do teste t de Welch

A seguir, realizaremos o teste t de Welch nas duas amostras a seguir para determinar se suas médias populacionais diferem significativamente em um nível de significância de 0,05:

Amostra 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25

Amostra 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34

Ilustraremos como realizar o teste de três maneiras diferentes:

  • Pela mão
  • Utilize o Microsoft Excel
  • Use a linguagem de programação estatística R

Teste T de Welch manualmente

Para realizar o teste t de Welch manualmente, primeiro precisamos encontrar as médias amostrais, as variâncias amostrais e os tamanhos amostrais:

x1 19,27
x2 23,69
s 1 2 – 20h42
arte 2 2 – 83,23
# 1 – 11
#
2 – 13

Então podemos inserir estes números para encontrar a estatística de teste:

Estatística de teste: ( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

Estatística de teste: (19,27 – 23,69) / (√ 20,42/11 + 83,23/13 ) = -4,42 / 2,873 = -1,538

Graus de liberdade: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }

Graus de liberdade: (20,42/11 + 83,23/13) 2 / { [ (20,42/11) 2 / (11 – 1) ] + [ (83,23/13) 2 / (13 – 1) ] } = 18,137. Arredondamos esse resultado para o número inteiro mais próximo, 18 .

Finalmente, encontraremos o valor crítico t na tabela de distribuição t que corresponde a um teste bilateral com alfa = 0,05 para 18 graus de liberdade:

Tabela de distribuição T

O valor crítico t é 2,101 . Como o valor absoluto da nossa estatística de teste (1,538) não é maior que o valor crítico t, não conseguimos rejeitar a hipótese nula do teste. Não há evidências suficientes para afirmar que as médias das duas populações sejam significativamente diferentes.

Teste T de Welch com Excel

Para realizar o teste t de Welch no Excel, primeiro precisamos baixar o software gratuito Analysis ToolPak. Se você ainda não baixou no Excel, escrevi um tutorial rápido sobre como fazer o download .

Depois de fazer download do Analysis ToolPak, você pode seguir as etapas abaixo para realizar o teste t de Welch em nossas duas amostras:

1. Insira os dados. Insira os valores dos dados para as duas amostras nas colunas A e B e os títulos Amostra 1 e Amostra 2 na primeira célula de cada coluna.

2. Execute o teste t de Welch usando o Analysis ToolPak. Vá para a guia Dados na faixa superior. Em seguida, no grupo Análise , clique no ícone Analysis ToolPak.

Na caixa de diálogo exibida, clique em teste t: duas amostras assumindo variações desiguais e clique em OK.

Por fim, preencha os valores abaixo e clique em OK:

O seguinte resultado deverá aparecer:

Observe que os resultados deste teste correspondem aos resultados que obtivemos manualmente:

  • A estatística de teste é -1,5379 .
  • O valor crítico bilateral é 2.1009 .
  • Como o valor absoluto da estatística de teste não é maior que o valor crítico bicaudal, as médias das duas populações não são estatisticamente diferentes.
  • Além disso, o valor p bicaudal do teste é 0,14, que é maior que 0,05 e confirma que as médias das duas populações não são estatisticamente diferentes.

Teste t de Welch usando R

O código a seguir ilustra como realizar o teste t de Welch para nossas duas amostras usando a linguagem de programação estatística R :

 #create two vectors to hold sample data values
sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25)
sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34)

#conduct Welch's test
t.test( sample1, sample2)

# Welch Two Sample t-test
#
#data: sample1 and sample2
#t = -1.5379, df = 18.137, p-value = 0.1413
#alternative hypothesis: true difference in means is not equal to 0
#95 percent confidence interval:
#-10.453875 1.614714
#sample estimates:
#mean of x mean of y 
#19.27273 23.69231 
#

A função t.test() exibe a seguinte saída relevante:

  • t: a estatística de teste = -1,5379
  • df : graus de liberdade = 18,137
  • Valor p: o valor p do teste bicaudal = 0,1413
  • Intervalo de confiança de 95% : o intervalo de confiança de 95% para a verdadeira diferença nas médias populacionais = (-10,45, 1,61)

Os resultados deste teste correspondem aos obtidos manualmente e em Excel: a diferença de médias para estas duas populações não é estatisticamente significativa ao nível de alfa = 0,05.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *