Como realizar um teste t de duas amostras em python
Um teste t de duas amostras é usado para testar se as médias de duas populações são iguais ou não.
Este tutorial explica como realizar um teste t de duas amostras em Python.
Exemplo: dois exemplos de teste t em Python
Os pesquisadores querem saber se duas espécies de plantas diferentes têm a mesma altura média. Para testar isso, eles coletam uma amostra aleatória simples de 20 plantas de cada espécie.
Siga as etapas a seguir para realizar um teste t de duas amostras para determinar se as duas espécies de plantas têm a mesma altura.
Etapa 1: crie os dados.
Primeiro, criaremos duas tabelas para armazenar as medidas de cada grupo de 20 plantas:
import numpy as np group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12]) group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])
Etapa 2: execute um teste t de duas amostras.
A seguir, usaremos a função ttest_ind() da biblioteca scipy.stats para realizar um teste t de dois exemplos, que usa a seguinte sintaxe:
ttest_ind(a, b, equal_var=Verdadeiro)
Ouro:
- a: uma tabela de exemplos de observações para o grupo 1
- b: uma tabela de exemplos de observações para o grupo 2
- equal_var: se verdadeiro, execute um teste t independente padrão para 2 amostras que assume variações populacionais iguais. Se for falso, execute o teste t de Welch , que não assume variâncias populacionais iguais. Isso é verdade por padrão.
Antes de realizar o teste, precisamos decidir se assumiremos ou não que as duas populações têm variâncias iguais. Geralmente, podemos assumir que as populações têm variâncias iguais se a razão entre a maior variância amostral e a menor variância amostral for inferior a 4:1.
#find variance for each group
print(np.var(group1), np.var(group2))
7.73 12.26
A razão entre a maior variância amostral e a menor variância amostral é 12,26/7,73 = 1,586 , que é menor que 4. Isso significa que podemos assumir que as variâncias da população são iguais.
Assim, podemos proceder à realização do teste t para duas amostras com variâncias iguais:
import scipy.stats as stats #perform two sample t-test with equal variances stats.ttest_ind(a=group1, b=group2, equal_var=True) (statistic=-0.6337, pvalue=0.53005)
A estatística do teste t é -0,6337 e o valor p bicaudal correspondente é 0,53005 .
Etapa 3: interprete os resultados.
As duas suposições para este teste t específico de duas amostras são:
H 0 : µ 1 = µ 2 (as duas médias populacionais são iguais)
HA : µ 1 ≠µ 2 (as duas médias populacionais não são iguais)
Como o valor p do nosso teste (0,53005) é maior que alfa = 0,05, não conseguimos rejeitar a hipótese nula do teste. Não temos evidências suficientes para afirmar que a altura média das plantas entre as duas populações seja diferente.
Recursos adicionais
Como realizar um teste T de uma amostra em Python
Como realizar um teste T de amostras emparelhadas em Python