Como realizar um teste t de duas amostras em python


Um teste t de duas amostras é usado para testar se as médias de duas populações são iguais ou não.

Este tutorial explica como realizar um teste t de duas amostras em Python.

Exemplo: dois exemplos de teste t em Python

Os pesquisadores querem saber se duas espécies de plantas diferentes têm a mesma altura média. Para testar isso, eles coletam uma amostra aleatória simples de 20 plantas de cada espécie.

Siga as etapas a seguir para realizar um teste t de duas amostras para determinar se as duas espécies de plantas têm a mesma altura.

Etapa 1: crie os dados.

Primeiro, criaremos duas tabelas para armazenar as medidas de cada grupo de 20 plantas:

 import numpy as np

group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12])
group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])

Etapa 2: execute um teste t de duas amostras.

A seguir, usaremos a função ttest_ind() da biblioteca scipy.stats para realizar um teste t de dois exemplos, que usa a seguinte sintaxe:

ttest_ind(a, b, equal_var=Verdadeiro)

Ouro:

  • a: uma tabela de exemplos de observações para o grupo 1
  • b: uma tabela de exemplos de observações para o grupo 2
  • equal_var: se verdadeiro, execute um teste t independente padrão para 2 amostras que assume variações populacionais iguais. Se for falso, execute o teste t de Welch , que não assume variâncias populacionais iguais. Isso é verdade por padrão.

Antes de realizar o teste, precisamos decidir se assumiremos ou não que as duas populações têm variâncias iguais. Geralmente, podemos assumir que as populações têm variâncias iguais se a razão entre a maior variância amostral e a menor variância amostral for inferior a 4:1.

 #find variance for each group
print(np.var(group1), np.var(group2))

7.73 12.26

A razão entre a maior variância amostral e a menor variância amostral é 12,26/7,73 = 1,586 , que é menor que 4. Isso significa que podemos assumir que as variâncias da população são iguais.

Assim, podemos proceder à realização do teste t para duas amostras com variâncias iguais:

 import scipy.stats as stats

#perform two sample t-test with equal variances
stats.ttest_ind(a=group1, b=group2, equal_var=True)

(statistic=-0.6337, pvalue=0.53005)

A estatística do teste t é -0,6337 e o valor p bicaudal correspondente é 0,53005 .

Etapa 3: interprete os resultados.

As duas suposições para este teste t específico de duas amostras são:

H 0 : µ 1 = µ 2 (as duas médias populacionais são iguais)

HA : µ 1 ≠µ 2 (as duas médias populacionais não são iguais)

Como o valor p do nosso teste (0,53005) é maior que alfa = 0,05, não conseguimos rejeitar a hipótese nula do teste. Não temos evidências suficientes para afirmar que a altura média das plantas entre as duas populações seja diferente.

Recursos adicionais

Como realizar um teste T de uma amostra em Python
Como realizar um teste T de amostras emparelhadas em Python

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *