Jak wykonać test kruskala-wallisa w stata


Test Kruskala-Wallisa służy do określenia, czy istnieje statystycznie istotna różnica między medianami trzech lub więcej niezależnych grup. Uważa się, że jest to nieparametryczny odpowiednik jednokierunkowej analizy wariancji ANOVA .

W tym samouczku wyjaśniono, jak wykonać test Kruskala-Wallisa w Stata.

Jak wykonać test Kruskala-Wallisa w Stata

W tym przykładzie użyjemy zbioru danych Census , który zawiera dane ze spisu powszechnego z 1980 roku dla wszystkich pięćdziesięciu stanów w Stanach Zjednoczonych. W zbiorze danych stany są podzielone na cztery różne regiony:

  • Nord Est
  • Północno-centralna
  • Południe
  • Zachód

Przeprowadzimy test Kruskala-Wallisa, aby ustalić, czy mediana wieku jest równa w tych czterech regionach.

Krok 1: Załaduj i wyświetl dane.

Najpierw załaduj zestaw danych, wpisując następujące polecenie w polu Polecenie:

użyj https://www.stata-press.com/data/r13/census

Uzyskaj szybkie podsumowanie zbioru danych za pomocą następującego polecenia:

podsumować

Podsumuj zbiór danych w Stata

Widzimy, że w tym zbiorze danych znajduje się 13 różnych zmiennych, ale będziemy pracować tylko z dwoma : średni wiek (mediana wieku) i region .

Krok 2: Wizualizuj dane.

Przed wykonaniem testu Kruskala-Wallisa utwórzmy najpierw kilka wykresów pudełkowych , aby zwizualizować rozkład mediany wieku dla każdego z czterech regionów:

pole graficzne wiadomości, włączone (region)

Wiele wykresów pudełkowych na jednym wykresie w Stata

Wystarczy spojrzeć na wykresy pudełkowe, aby zobaczyć, że rozkłady wydają się różnić w zależności od regionu. Następnie przeprowadzimy test Kruskala-Wallisa, aby sprawdzić, czy różnice te są istotne statystycznie.

Krok 3: Wykonaj test Kruskala-Wallisa.

Aby wykonać test Kruskala-Wallisa, użyj poniższej składni:

kwallis zmienna_miary, według (zmienna_grupowania)

W naszym przypadku zastosujemy następującą składnię:

kwallis medage, według (regionu)

Dane wyjściowe Kruskala-Wallisa dla Staty

Oto jak zinterpretować wynik:

Tabela podsumowująca: Ta tabela pokazuje liczbę obserwacji na region i sumy rankingowe dla każdego regionu.

Chi-kwadrat z remisami: Jest to wartość statystyki testowej, która wynosi 17,062.

prawdopodobieństwo: Jest to wartość p odpowiadająca statystyce testowej, która okazuje się wynosić 0,0007. Ponieważ wartość ta jest mniejsza niż 0,05, możemy odrzucić hipotezę zerową i stwierdzić, że mediana wieku nie jest równa w czterech regionach.

Krok 4: Ogłoś wyniki.

Na koniec chcielibyśmy przedstawić wyniki testu Kruskala-Wallisa. Oto przykład, jak to zrobić:

Przeprowadzono test Kruskala-Wallista w celu ustalenia, czy mediana wieku osób była taka sama w następujących czterech regionach Stanów Zjednoczonych:

  • Północno-wschodni (n=9)
  • Północno-Środkowy (n=12)
  • Południe (n=16)
  • Zachód (n=13)

Test wykazał, że mediana wieku osób nie była jednakowa w czterech regionach (X 2 = 17,062, p = 0,0007). Oznacza to, że istniała statystycznie istotna różnica w medianie wieku między dwoma lub większą liczbą regionów.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *