Como realizar um teste de kruskal-wallis no stata


Um teste de Kruskal-Wallis é usado para determinar se existe ou não uma diferença estatisticamente significativa entre as medianas de três ou mais grupos independentes. É considerado o equivalente não paramétrico da ANOVA unidirecional .

Este tutorial explica como realizar um teste de Kruskal-Wallis no Stata.

Como realizar um teste de Kruskal-Wallis no Stata

Para este exemplo, usaremos o conjunto de dados do Censo , que contém dados do censo de 1980 para todos os cinquenta estados dos Estados Unidos. No conjunto de dados, os estados são categorizados em quatro regiões diferentes:

  • Norte do Leste
  • Central norte
  • Sul
  • Oeste

Realizaremos um teste de Kruskal-Wallis para determinar se a idade mediana é igual nessas quatro regiões.

Etapa 1: Carregar e exibir dados.

Primeiro, carregue o conjunto de dados digitando o seguinte comando na caixa Comando:

use https://www.stata-press.com/data/r13/census

Obtenha um resumo rápido do conjunto de dados usando o seguinte comando:

resumir

Resuma um conjunto de dados no Stata

Podemos ver que existem 13 variáveis diferentes neste conjunto de dados, mas as únicas duas com as quais trabalharemos são mediana (idade mediana) e região .

Etapa 2: visualize os dados.

Antes de realizar o teste de Kruskal-Wallis, vamos primeiro criar alguns box plots para visualizar a distribuição mediana da idade para cada uma das quatro regiões:

caixa gráfica Medage, em (região)

Vários boxplots em um único gráfico no Stata

Apenas olhando para os box plots, você pode ver que as distribuições parecem variar de região para região. Em seguida, realizaremos um teste de Kruskal-Wallis para verificar se essas diferenças são estatisticamente significativas.

Etapa 3: execute um teste de Kruskal-Wallis.

Use a seguinte sintaxe para realizar um teste de Kruskal-Wallis:

kwallis medida_variável, por (agrupamento_variável)

No nosso caso, usaremos a seguinte sintaxe:

Medagem kwallis, por (região)

Saída de Kruskal-Wallis para Stata

Veja como interpretar o resultado:

Tabela resumo: Esta tabela mostra o número de observações por região e as somas de classificação para cada região.

Qui-quadrado com empates: Este é o valor da estatística de teste, que resulta em 17,062.

probabilidade: este é o valor p que corresponde à estatística de teste, que é 0,0007. Dado que este valor é inferior a 0,05, podemos rejeitar a hipótese nula e concluir que a idade mediana não é igual nas quatro regiões.

Etapa 4: relatar os resultados.

Por fim, gostaríamos de reportar os resultados do teste Kruskal-Wallis. Aqui está um exemplo de como fazer isso:

Um teste de Kruskal-Wallist foi realizado para determinar se a idade mediana dos indivíduos era a mesma nas seguintes quatro regiões dos Estados Unidos:

  • Nordeste (n=9)
  • Centro-Norte (n=12)
  • Sul (n=16)
  • Oeste (n=13)

O teste revelou que a mediana de idade dos indivíduos não era a mesma (X 2 = 17,062, p = 0,0007) nas quatro regiões. Ou seja, houve diferença estatisticamente significativa na mediana de idade entre duas ou mais regiões.

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *