Como realizar um teste de ajuste qui-quadrado em python
Um teste de ajuste qui-quadrado é usado para determinar se uma variável categórica segue ou não uma distribuição hipotética.
Este tutorial explica como realizar um teste de adequação do qui-quadrado em Python.
Exemplo: teste de adequação do qui-quadrado em Python
O dono de uma loja diz que um número igual de clientes vem à sua loja todos os dias da semana. Para testar esta hipótese, um pesquisador registra o número de clientes que entram na loja em uma determinada semana e descobre o seguinte:
- Segunda-feira: 50 clientes
- Terça-feira: 60 clientes
- Quarta-feira: 40 clientes
- Quinta-feira: 47 clientes
- Sexta-feira: 53 clientes
Use as etapas a seguir para realizar um teste de adequação do qui-quadrado em Python para determinar se os dados são consistentes com a afirmação do proprietário da loja.
Etapa 1: crie os dados.
Primeiro, criaremos duas tabelas para conter nosso número observado e esperado de clientes para cada dia:
expected = [50, 50, 50, 50, 50] observed = [50, 60, 40, 47, 53]
Etapa 2: execute o teste de adequação do qui-quadrado.
Em seguida, podemos realizar o teste de adequação do qui-quadrado usando a função qui-quadrado da biblioteca SciPy, que usa a seguinte sintaxe:
qui quadrado (f_obs, f_exp)
Ouro:
- f_obs: uma matriz de contagens observadas.
- f_exp: uma matriz de contagens esperadas. Por padrão, cada categoria é considerada igualmente provável.
O código a seguir mostra como usar esta função em nosso exemplo específico:
import scipy.stats as stats #perform Chi-Square Goodness of Fit Test stats.chisquare(f_obs=observed, f_exp=expected) (statistic=4.36, pvalue=0.35947)
A estatística do teste qui-quadrado é 4,36 e o valor p correspondente é 0,35947 .
Observe que o valor p corresponde a um valor qui-quadrado com n-1 graus de liberdade (dof), onde n é o número de categorias diferentes. Neste caso, dof = 5-1 = 4. Você pode usar a calculadora do qui-quadrado para valor P para confirmar que o valor p que corresponde a X 2 = 4,36 com dof = 4 é 0,35947 .
Lembre-se de que um teste de adequação do qui-quadrado usa as seguintes hipóteses nulas e alternativas:
- H 0 : (hipótese nula) Uma variável segue uma distribuição hipotética.
- H 1 : (hipótese alternativa) Uma variável não segue uma distribuição hipotética.
Como o valor p (0,35947) não é inferior a 0,05, não rejeitamos a hipótese nula. Isso significa que não temos evidências suficientes para afirmar que a verdadeira distribuição dos clientes é diferente daquela relatada pelo lojista.