Como realizar um teste t de duas amostras no stata


Um teste t de duas amostras é usado para testar se as médias de duas populações são iguais ou não.

Este tutorial explica como realizar um teste t de duas amostras no Stata.

Exemplo: teste t de duas amostras no Stata

Os pesquisadores querem saber se um novo tratamento de combustível causa uma alteração no mpg médio de um determinado carro. Para testar isso, eles conduzem um experimento no qual 12 carros recebem o novo tratamento de combustível e 12 carros não.

Conclua as etapas a seguir para realizar um teste t de duas amostras para determinar se há uma diferença na média de mpg entre esses dois grupos.

Etapa 1: carregar dados.

Primeiro, carregue os dados digitando use https://www.stata-press.com/data/r13/fuel3 na caixa de comando e clicando Enter.

Dois exemplos de teste t no exemplo Stata

Etapa 2: visualize os dados brutos.

Antes de realizar um teste t de duas amostras, vamos primeiro examinar os dados brutos. Na barra de menu superior, navegue até Dados > Editor de dados > Editor de dados (navegar) . A primeira coluna, mpg , exibe o mpg de um determinado carro. A segunda coluna, tratada , indica se o carro recebeu ou não tratamento de combustível (0 = não, 1 = sim).

Visualize dados brutos no Stata

Etapa 3: visualize os dados.

A seguir, vamos visualizar os dados. Criaremos boxplots para exibir a distribuição dos valores de mpg para cada grupo.

Na barra de menu superior, vá para Charts > Box plot . Em variáveis, escolha mpg :

Em seguida, no subtítulo Categorias em Variável de agrupamento, escolha Processado :

Clique em OK . Um gráfico com dois boxplots será exibido automaticamente:

Boxplots lado a lado no Stata

Podemos ver imediatamente que o mpg parece ser maior para o grupo tratado (1) em comparação com o grupo não tratado (0), mas precisamos realizar um teste t de duas amostras para ver se essas diferenças são estatisticamente significativas. .

Etapa 4: execute um teste t de duas amostras.

Na barra de menu superior, vá para Estatísticas > Resumos, Tabelas e Testes > Testes de Hipóteses Clássicos > Teste t (teste de comparação de médias) .

Escolha Duas amostras usando grupos . Para Nome da variável, escolha mpg . Para Nome da variável de grupo, escolha Processado . Para Nível de confiança, escolha o nível desejado. Um valor de 95 corresponde a um nível de significância de 0,05. Deixaremos isso em 95. Por fim, clique em OK .

Exemplo de teste t de duas amostras no Stata

Os resultados dos dois testes t de amostra serão exibidos:

Teste t de duas amostras na interpretação do Stata

Recebemos as seguintes informações para cada grupo:

Obs: O número de observações. Existem 12 observações em cada grupo.

Média: O mpg médio. No grupo 0 a média é 21. No grupo 1 a média é 22,75.

Padrão. Err: o erro padrão, calculado como σ / √ n

Padrão. Dev: o desvio padrão de mpg.

95% Conf. Faixa: intervalo de confiança de 95% para a verdadeira média da população em mpg.

t: a estatística de teste do teste t de duas amostras.

graus de liberdade: Os graus de liberdade a serem usados para o teste, calculados como n-2 = 24-2 = 22.

Os valores p para três testes t diferentes para duas amostras são mostrados na parte inferior dos resultados. Como queremos entender se o mpg médio é simplesmente diferente entre os dois grupos, examinaremos os resultados do teste intermediário (no qual a hipótese alternativa é Ha:diff!=0) que tem um valor p de 0,1673. .

Como este valor não está abaixo do nosso nível de significância de 0,05, não rejeitamos a hipótese nula. Não temos evidências suficientes para dizer que a verdadeira média de mpg é diferente entre os dois grupos.

Etapa 5: Relate os resultados.

Finalmente, relataremos os resultados de nossos dois testes t de amostra. Aqui está um exemplo de como fazer isso:

Um teste T de duas amostras foi realizado em 24 carros para determinar se um novo tratamento de combustível causou uma diferença na média de milhas por galão. Cada grupo continha 12 carros.

Os resultados mostraram que o mpg médio não foi diferente entre os dois grupos (t = -1,428 com gl=22, p = 0,1673) a um nível de significância de 0,05.

Um intervalo de confiança de 95% para a verdadeira diferença nas médias populacionais deu o intervalo de (-4,29, 0,79).

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *