Como realizar um teste de ajuste qui-quadrado em r
Um teste de ajuste qui-quadrado é usado para determinar se uma variável categórica segue ou não uma distribuição hipotética.
Este tutorial explica como realizar um teste de qualidade de ajuste qui-quadrado em R.
Exemplo: teste de ajuste qui-quadrado em R
O dono de uma loja diz que um número igual de clientes vem à sua loja todos os dias da semana. Para testar esta hipótese, um pesquisador registra o número de clientes que entram na loja em uma determinada semana e descobre o seguinte:
- Segunda-feira: 50 clientes
- Terça-feira: 60 clientes
- Quarta-feira: 40 clientes
- Quinta-feira: 47 clientes
- Sexta-feira: 53 clientes
Siga as etapas a seguir para realizar um teste de adequação do qui-quadrado em R para determinar se os dados são consistentes com a afirmação do proprietário da loja.
Etapa 1: crie os dados.
Primeiro, criaremos duas tabelas para conter nossas frequências observadas e nossa proporção esperada de clientes para cada dia:
observed <- c(50, 60, 40, 47, 53)
expected <- c(.2, .2, .2, .2, .2) #must add up to 1
Etapa 2: execute o teste de adequação do qui-quadrado.
A seguir, podemos realizar o teste de ajuste qui-quadrado usando a função chisq.test() , que usa a seguinte sintaxe:
chisq.teste(x, p)
Ouro:
- x: Um vetor numérico de frequências observadas.
- p: Um vetor numérico de proporções esperadas.
O código a seguir mostra como usar esta função em nosso exemplo:
#perform Chi-Square Goodness of Fit Test
chisq.test(x=observed, p=expected)
Chi-squared test for given probabilities
data: observed
X-squared = 4.36, df = 4, p-value = 0.3595
A estatística do teste qui-quadrado é 4,36 e o valor p correspondente é 0,3595 .
Observe que o valor p corresponde a um valor qui-quadrado com n-1 graus de liberdade (dof), onde n é o número de categorias diferentes. Neste caso, df = 5-1 = 4.
Você pode usar a calculadora do qui-quadrado para valor P para confirmar que o valor p que corresponde a X 2 = 4,36 com df = 4 é 0,35947 .
Lembre-se de que um teste de adequação do qui-quadrado usa as seguintes hipóteses nulas e alternativas:
- H 0 : (hipótese nula) Uma variável segue uma distribuição hipotética.
- H 1 : (hipótese alternativa) Uma variável não segue uma distribuição hipotética.
Como o valor p (0,35947) não é inferior a 0,05, não rejeitamos a hipótese nula. Isso significa que não temos evidências suficientes para afirmar que a verdadeira distribuição dos clientes é diferente daquela relatada pelo lojista.
Recursos adicionais
Como realizar um teste de independência qui-quadrado em R
Como calcular o valor P de uma estatística qui-quadrado em R
Como encontrar o valor crítico do qui quadrado em R