As quatro hipóteses formuladas em um teste t


Um teste t de duas amostras é usado para testar se as médias de duas populações são iguais ou não.

Este tipo de teste faz as seguintes suposições sobre os dados:

1. Independência: as observações de uma amostra são independentes das observações da outra amostra.

2. Normalidade: Ambas as amostras apresentam distribuição aproximadamente normal.

3. Homogeneidade de variâncias: As duas amostras têm aproximadamente a mesma variância.

4. Amostragem Aleatória: Ambas as amostras foram obtidas pelo método de amostragem aleatória.

Se uma ou mais destas suposições forem violadas, os resultados do teste t para duas amostras podem não ser confiáveis ou até mesmo enganosos.

Neste tutorial, fornecemos uma explicação de cada suposição, como determinar se a suposição foi atendida e o que fazer se for violada.

Hipótese 1: Independência

Um teste t de duas amostras assume que as observações de uma amostra são independentes das observações da outra amostra.

Esta é uma suposição crucial porque se os mesmos indivíduos aparecem em ambas as amostras, então não é válido tirar conclusões sobre as diferenças entre as amostras.

Como verificar esta hipótese

A maneira mais simples de testar esta suposição é verificar se cada observação aparece apenas uma vez em cada amostra e se as observações em cada amostra foram coletadas por amostragem aleatória.

O que fazer se esta suposição não for respeitada

Se esta suposição não for atendida, os resultados do teste t de duas amostras são completamente inválidos. Neste cenário, é melhor recolher duas novas amostras utilizando um método de amostragem aleatória e garantir que cada indivíduo numa amostra não pertence à outra amostra.

Hipótese 2: normalidade

Um teste t de duas amostras assume que as duas amostras têm distribuição aproximadamente normal.

Esta é uma suposição crucial porque se as amostras não forem normalmente distribuídas, não é válido usar os valores p do teste para tirar conclusões sobre as diferenças entre as amostras.

Como verificar esta hipótese

Se os tamanhos amostrais forem pequenos (n <50), podemos usar um teste de Shapiro-Wilk para determinar se cada tamanho amostral é normalmente distribuído. Se o valor p do teste estiver abaixo de um certo nível de significância, os dados provavelmente não estão normalmente distribuídos.

Se os tamanhos amostrais forem grandes, é melhor usar um gráfico QQ para verificar visualmente se os dados estão distribuídos normalmente.

Se os pontos de dados estiverem aproximadamente ao longo de uma linha reta diagonal em um gráfico QQ, então o conjunto de dados provavelmente segue uma distribuição normal.

O que fazer se esta suposição não for respeitada

Se esta suposição for violada, então podemos realizar um teste U de Mann-Whitney , que é considerado o equivalente não paramétrico do teste t de duas amostras e não pressupõe que as duas amostras sejam normalmente distribuídas.

Hipótese 3: Homogeneidade das diferenças

Um teste t de duas amostras assume que as duas amostras têm variâncias aproximadamente iguais.

Como verificar esta hipótese

Usamos a seguinte regra prática para determinar se as variâncias entre as duas amostras são iguais: Se a razão entre a maior variância e a menor variância for menor que 4, então podemos assumir que as variâncias são aproximadamente iguais e usar ambas as amostras t -teste.

Por exemplo, suponha que a amostra 1 tenha uma variância de 24,5 e a amostra 2 tenha uma variância de 15,2. A razão entre a maior variância amostral e a menor variância amostral seria calculada da seguinte forma:

Proporção: 24,5 / 15,2 = 1,61

Sendo esta proporção inferior a 4, pode-se assumir que as diferenças entre os dois grupos são aproximadamente iguais.

O que fazer se esta suposição não for respeitada

Se esta suposição for violada, então podemos realizar o teste t de Welch , que é uma versão não paramétrica do teste t de duas amostras e não pressupõe que as duas amostras tenham variâncias iguais.

Premissa 4: Amostragem aleatória

Um teste t de duas amostras pressupõe que ambas as amostras foram obtidas usando um método de amostragem aleatória.

Como verificar esta hipótese

Não existe nenhum teste estatístico formal que possamos usar para testar esta hipótese. Em vez disso, precisamos apenas garantir que ambas as amostras foram obtidas usando um método de amostragem aleatória , de modo que cada indivíduo da população de interesse tenha igual probabilidade de ser incluído em uma ou outra amostra.

O que fazer se esta suposição não for respeitada

Se esta suposição não for satisfeita, então é improvável que as nossas duas amostras sejam representativas da população de interesse. Neste caso, não podemos generalizar de forma confiável os resultados do teste t de duas amostras para a população geral.

Neste cenário, é melhor coletar duas novas amostras utilizando um método de amostragem aleatória.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *