Come eseguire un test kruskal-wallis a stata


Un test di Kruskal-Wallis viene utilizzato per determinare se esiste o meno una differenza statisticamente significativa tra le mediane di tre o più gruppi indipendenti. È considerato l’equivalente non parametrico dell’ANOVA unidirezionale .

Questo tutorial spiega come eseguire un test Kruskal-Wallis in Stata.

Come eseguire un test Kruskal-Wallis a Stata

Per questo esempio utilizzeremo il set di dati Census , che contiene i dati del censimento del 1980 per tutti i cinquanta stati degli Stati Uniti. Nel set di dati, gli stati sono classificati in quattro diverse regioni:

  • Nord Est
  • Centro-Nord
  • Sud
  • ovest

Effettueremo un test Kruskal-Wallis per determinare se l’età media è uguale in queste quattro regioni.

Passaggio 1: caricare e visualizzare i dati.

Innanzitutto, carica il set di dati digitando il seguente comando nella casella Comando:

utilizzare https://www.stata-press.com/data/r13/census

Ottieni un breve riepilogo del set di dati utilizzando il seguente comando:

riassumere

Riepilogare un set di dati in Stata

Possiamo vedere che ci sono 13 variabili diverse in questo set di dati, ma le uniche due con cui lavoreremo sono medage (età mediana) e regione .

Passaggio 2: visualizzare i dati.

Prima di eseguire il test di Kruskal-Wallis, creiamo alcuni box plot per visualizzare la distribuzione mediana dell’età per ciascuna delle quattro regioni:

casella grafica Medage, su (regione)

Boxplot multipli in un unico appezzamento in Stata

Basta osservare i box plot per notare che le distribuzioni sembrano variare da regione a regione. Eseguiremo quindi un test di Kruskal-Wallis per vedere se queste differenze sono statisticamente significative.

Passaggio 3: eseguire un test Kruskal-Wallis.

Utilizzare la seguente sintassi per eseguire un test Kruskal-Wallis:

kwallis misura_variabile, per (raggruppamento_variabile)

Nel nostro caso utilizzeremo la seguente sintassi:

kwallis medage, di (regione)

Uscita Kruskal-Wallis alla Stata

Ecco come interpretare il risultato:

Tabella riepilogativa: questa tabella mostra il numero di osservazioni per regione e le somme della classifica per ciascuna regione.

Chi quadrato con parità: questo è il valore della statistica del test, che risulta essere 17.062.

probabilità: questo è il valore p che corrisponde alla statistica del test, che risulta essere 0,0007. Poiché questo valore è inferiore a 0,05, possiamo rifiutare l’ipotesi nulla e concludere che l’età mediana non è uguale nelle quattro regioni.

Passaggio 4: riportare i risultati.

Riportiamo infine i risultati del test di Kruskal-Wallis. Ecco un esempio di come eseguire questa operazione:

È stato eseguito un test Kruskal-Wallist per determinare se l’età media degli individui era la stessa nelle seguenti quattro regioni degli Stati Uniti:

  • Nord-est (n=9)
  • Centro-Nord (n=12)
  • Sud (n=16)
  • Ovest (n=13)

Il test ha rivelato che l’età media degli individui non era la stessa (X 2 = 17,062, p = 0,0007) nelle quattro regioni. Cioè, c’era una differenza statisticamente significativa nell’età media tra due o più regioni.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *