Como realizar um teste de ajuste qui-quadrado em python


Um teste de ajuste qui-quadrado é usado para determinar se uma variável categórica segue ou não uma distribuição hipotética.

Este tutorial explica como realizar um teste de adequação do qui-quadrado em Python.

Exemplo: teste de adequação do qui-quadrado em Python

O dono de uma loja diz que um número igual de clientes vem à sua loja todos os dias da semana. Para testar esta hipótese, um pesquisador registra o número de clientes que entram na loja em uma determinada semana e descobre o seguinte:

  • Segunda-feira: 50 clientes
  • Terça-feira: 60 clientes
  • Quarta-feira: 40 clientes
  • Quinta-feira: 47 clientes
  • Sexta-feira: 53 clientes

Use as etapas a seguir para realizar um teste de adequação do qui-quadrado em Python para determinar se os dados são consistentes com a afirmação do proprietário da loja.

Etapa 1: crie os dados.

Primeiro, criaremos duas tabelas para conter nosso número observado e esperado de clientes para cada dia:

 expected = [50, 50, 50, 50, 50]
observed = [50, 60, 40, 47, 53]

Etapa 2: execute o teste de adequação do qui-quadrado.

Em seguida, podemos realizar o teste de adequação do qui-quadrado usando a função qui-quadrado da biblioteca SciPy, que usa a seguinte sintaxe:

qui quadrado (f_obs, f_exp)

Ouro:

  • f_obs: uma matriz de contagens observadas.
  • f_exp: uma matriz de contagens esperadas. Por padrão, cada categoria é considerada igualmente provável.

O código a seguir mostra como usar esta função em nosso exemplo específico:

 import scipy.stats as stats

#perform Chi-Square Goodness of Fit Test
stats.chisquare(f_obs=observed, f_exp=expected)

(statistic=4.36, pvalue=0.35947)

A estatística do teste qui-quadrado é 4,36 e o valor p correspondente é 0,35947 .

Observe que o valor p corresponde a um valor qui-quadrado com n-1 graus de liberdade (dof), onde n é o número de categorias diferentes. Neste caso, dof = 5-1 = 4. Você pode usar a calculadora do qui-quadrado para valor P para confirmar que o valor p que corresponde a X 2 = 4,36 com dof = 4 é 0,35947 .

Lembre-se de que um teste de adequação do qui-quadrado usa as seguintes hipóteses nulas e alternativas:

  • H 0 : (hipótese nula) Uma variável segue uma distribuição hipotética.
  • H 1 : (hipótese alternativa) Uma variável não segue uma distribuição hipotética.

Como o valor p (0,35947) não é inferior a 0,05, não rejeitamos a hipótese nula. Isso significa que não temos evidências suficientes para afirmar que a verdadeira distribuição dos clientes é diferente daquela relatada pelo lojista.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *