Jak wykonać test dobroci dopasowania chi-kwadrat w stata


Test dobroci dopasowania chi-kwadrat służy do określenia, czy zmienna kategoryczna ma rozkład hipotetyczny.

W tym samouczku wyjaśniono, jak przeprowadzić test dobroci dopasowania chi-kwadrat w programie Stata.

Przykład: test dobroci dopasowania chi-kwadrat w programie Stata

Aby zilustrować sposób przeprowadzenia tego testu, użyjemy zbioru danych o nazwie nlsw88 , który zawiera informacje na temat statystyk pracy kobiet w Stanach Zjednoczonych w 1988 roku.

Wykonaj następujące kroki, aby przeprowadzić test dobroci dopasowania chi-kwadrat w celu ustalenia, czy prawdziwy rozkład rasy w tym zbiorze danych to: 70% rasy białej, 20% rasy czarnej, 10% innej rasy.

Krok 1: Załaduj i wyświetl surowe dane.

Najpierw załadujemy dane wpisując następującą komendę:

systemu nlsw88

Surowe dane możemy wyświetlić wpisując następującą komendę:

br

Wyświetl surowe dane w Stata

Każdy wiersz wyświetla informacje o danej osobie, w tym jej wiek, rasę, stan cywilny, poziom wykształcenia i różne inne czynniki.

Krok 2: Załaduj pakiet dostosowawczy.

Aby przeprowadzić test przydatności, będziemy musieli zainstalować pakiet csgof . Możemy to zrobić wpisując następujące polecenie:

znajdź csgofa

Pojawi się nowe okno. Kliknij link csgof z https://stats.idre.ucla.edu/stat/stata/ado/analytic .

Pojawi się kolejne okno. Kliknij łącze z informacją Kliknij tutaj, aby zainstalować .

Instalacja pakietu powinna zająć tylko kilka sekund.

Krok 3: Wykonaj test dopasowania.

Po zainstalowaniu pakietu możemy przeprowadzić test zgodności danych, aby ustalić, czy prawdziwy podział ras jest następujący: 70% rasy białej, 20% rasy czarnej, 10% innej rasy.

Do wykonania testu użyjemy następującej składni:

csgof zmienna_zainteresowań, expperc(lista_oczekiwanych_procentów)

Oto dokładna składnia, której użyjemy w naszym przypadku:

uruchom csgof, expperc(70, 20, 10)

Dobroć dopasowania chi-kwadrat w Stata

Oto jak zinterpretować wynik:

Pole podsumowania: To pole pokazuje oczekiwany procent, oczekiwaną częstotliwość i obserwowaną częstotliwość dla każdego wyścigu. Na przykład:

  • Oczekiwany odsetek osobników rasy białej wynosił 70%. To jest procent, który podaliśmy.
  • Oczekiwana liczebność osobników rasy białej wyniosła 1572,2. Oblicza się to na podstawie faktu, że w zbiorze danych było 2246 osób, zatem 70% tej liczby to 1572,2.
  • Zaobserwowana częstość występowania osobników rasy białej wynosiła 1637. To jest rzeczywista liczba białych osób w zbiorze danych.

Chisq(2): Jest to statystyka testu Chi-kwadrat dla testu dobroci dopasowania. Okazuje się, że jest to 218,13.

p: Jest to wartość p powiązana ze statystyką testu chi-kwadrat. Okazuje się, że wynosi 0. Ponieważ jest mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej, że prawdziwy rozkład rasowy to 70% rasy białej, 20% czarnej i 10% innej rasy. Mamy wystarczająco dużo dowodów, aby stwierdzić, że prawdziwy rozkład rasowy różni się od tego hipotetycznego rozkładu.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *