Como realizar um teste de qualidade de ajuste qui-quadrado no stata
Um teste de ajuste qui-quadrado é usado para determinar se uma variável categórica segue ou não uma distribuição hipotética.
Este tutorial explica como realizar um teste de ajuste qui-quadrado no Stata.
Exemplo: teste de ajuste qui-quadrado no Stata
Para ilustrar como realizar este teste, utilizaremos um conjunto de dados chamado nlsw88 , que contém informações sobre estatísticas de trabalho feminino nos Estados Unidos em 1988.
Siga as etapas a seguir para realizar um teste de adequação do qui-quadrado para determinar se a verdadeira distribuição de raça neste conjunto de dados é: 70% brancos, 20% negros, 10% outros.
Etapa 1: Carregar e exibir dados brutos.
Primeiro, carregaremos os dados digitando o seguinte comando:
sistema nlsw88
Podemos visualizar os dados brutos digitando o seguinte comando:
br
Cada linha exibe informações sobre um indivíduo, incluindo idade, raça, estado civil, nível de escolaridade e vários outros fatores.
Passo 2: Carregue o pacote de ajuste.
Para realizar um teste de adequação, precisaremos instalar o pacote csgof . Podemos fazer isso digitando o seguinte comando:
encontrar csgof
Uma nova janela aparecerá. Clique no link que diz csgof em https://stats.idre.ucla.edu/stat/stata/ado/análise .
Outra janela aparecerá. Clique no link que diz clique aqui para instalar .
A instalação do pacote deve levar apenas alguns segundos.
Etapa 3: execute o teste de ajuste.
Depois que o pacote for instalado, podemos realizar o teste de ajuste nos dados para determinar se a verdadeira distribuição racial é: 70% Branco, 20% Preto, 10% Outro.
Usaremos a seguinte sintaxe para realizar o teste:
csgof variável_de_interesse, expperc(lista_de_percentagens_esperadas)
Aqui está a sintaxe exata que usaremos em nosso caso:
execute csgof,expperc(70, 20, 10)
Veja como interpretar o resultado:
Caixa de resumo: Esta caixa mostra a porcentagem esperada, a frequência esperada e a frequência observada para cada corrida. Por exemplo:
- O percentual esperado de indivíduos brancos era de 70%. Esta é a porcentagem que especificamos.
- A frequência esperada de indivíduos brancos foi de 1.572,2. Isso é calculado usando o fato de que havia 2.246 indivíduos no conjunto de dados, então 70% desse número é 1.572,2.
- A frequência observada de indivíduos brancos foi de 1.637. Este é o número real de indivíduos brancos no conjunto de dados.
Chisq(2): Esta é a estatística do teste Qui-quadrado para o teste de adequação. Acontece que é 218,13.
p: Este é o valor p associado à estatística do teste Qui-quadrado. Acontece que é 0. Como é inferior a 0,05, não rejeitamos a hipótese nula de que a verdadeira distribuição racial é 70% de brancos, 20% de negros e 10% de outros. Temos evidências suficientes para concluir que a verdadeira distribuição racial é diferente desta distribuição hipotética.