Jak wykonać test dobroci dopasowania chi-kwadrat w stata
Test dobroci dopasowania chi-kwadrat służy do określenia, czy zmienna kategoryczna ma rozkład hipotetyczny.
W tym samouczku wyjaśniono, jak przeprowadzić test dobroci dopasowania chi-kwadrat w programie Stata.
Przykład: test dobroci dopasowania chi-kwadrat w programie Stata
Aby zilustrować sposób przeprowadzenia tego testu, użyjemy zbioru danych o nazwie nlsw88 , który zawiera informacje na temat statystyk pracy kobiet w Stanach Zjednoczonych w 1988 roku.
Wykonaj następujące kroki, aby przeprowadzić test dobroci dopasowania chi-kwadrat w celu ustalenia, czy prawdziwy rozkład rasy w tym zbiorze danych to: 70% rasy białej, 20% rasy czarnej, 10% innej rasy.
Krok 1: Załaduj i wyświetl surowe dane.
Najpierw załadujemy dane wpisując następującą komendę:
systemu nlsw88
Surowe dane możemy wyświetlić wpisując następującą komendę:
br
Każdy wiersz wyświetla informacje o danej osobie, w tym jej wiek, rasę, stan cywilny, poziom wykształcenia i różne inne czynniki.
Krok 2: Załaduj pakiet dostosowawczy.
Aby przeprowadzić test przydatności, będziemy musieli zainstalować pakiet csgof . Możemy to zrobić wpisując następujące polecenie:
znajdź csgofa
Pojawi się nowe okno. Kliknij link csgof z https://stats.idre.ucla.edu/stat/stata/ado/analytic .
Pojawi się kolejne okno. Kliknij łącze z informacją Kliknij tutaj, aby zainstalować .
Instalacja pakietu powinna zająć tylko kilka sekund.
Krok 3: Wykonaj test dopasowania.
Po zainstalowaniu pakietu możemy przeprowadzić test zgodności danych, aby ustalić, czy prawdziwy podział ras jest następujący: 70% rasy białej, 20% rasy czarnej, 10% innej rasy.
Do wykonania testu użyjemy następującej składni:
csgof zmienna_zainteresowań, expperc(lista_oczekiwanych_procentów)
Oto dokładna składnia, której użyjemy w naszym przypadku:
uruchom csgof, expperc(70, 20, 10)
Oto jak zinterpretować wynik:
Pole podsumowania: To pole pokazuje oczekiwany procent, oczekiwaną częstotliwość i obserwowaną częstotliwość dla każdego wyścigu. Na przykład:
- Oczekiwany odsetek osobników rasy białej wynosił 70%. To jest procent, który podaliśmy.
- Oczekiwana liczebność osobników rasy białej wyniosła 1572,2. Oblicza się to na podstawie faktu, że w zbiorze danych było 2246 osób, zatem 70% tej liczby to 1572,2.
- Zaobserwowana częstość występowania osobników rasy białej wynosiła 1637. To jest rzeczywista liczba białych osób w zbiorze danych.
Chisq(2): Jest to statystyka testu Chi-kwadrat dla testu dobroci dopasowania. Okazuje się, że jest to 218,13.
p: Jest to wartość p powiązana ze statystyką testu chi-kwadrat. Okazuje się, że wynosi 0. Ponieważ jest mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej, że prawdziwy rozkład rasowy to 70% rasy białej, 20% czarnej i 10% innej rasy. Mamy wystarczająco dużo dowodów, aby stwierdzić, że prawdziwy rozkład rasowy różni się od tego hipotetycznego rozkładu.