Jak wykonać test dobroci dopasowania chi-kwadrat w pythonie


Test dobroci dopasowania chi-kwadrat służy do określenia, czy zmienna kategoryczna ma rozkład hipotetyczny.

W tym samouczku wyjaśniono, jak przeprowadzić test dobroci dopasowania chi-kwadrat w języku Python.

Przykład: test zgodności chi-kwadrat w Pythonie

Właściciel sklepu twierdzi, że w każdym dniu tygodnia do jego sklepu przychodzi taka sama liczba klientów. Aby przetestować tę hipotezę, badacz rejestruje liczbę klientów, którzy przychodzą do sklepu w danym tygodniu i stwierdza, co następuje:

  • Poniedziałek: 50 klientów
  • Wtorek: 60 klientów
  • Środa: 40 klientów
  • Czwartek: 47 klientów
  • Piątek: 53 klientów

Wykonaj poniższe kroki, aby przeprowadzić test zgodności chi-kwadrat w języku Python w celu ustalenia, czy dane są zgodne z twierdzeniami właściciela sklepu.

Krok 1: Utwórz dane.

Najpierw utworzymy dwie tabele zawierające obserwowaną i oczekiwaną liczbę klientów na każdy dzień:

 expected = [50, 50, 50, 50, 50]
observed = [50, 60, 40, 47, 53]

Krok 2: Wykonaj test dobroci dopasowania chi-kwadrat.

Następnie możemy wykonać test dobroci dopasowania chi-kwadrat, korzystając z funkcji chi-kwadrat z biblioteki SciPy, która wykorzystuje następującą składnię:

chi kwadrat (f_obs, f_exp)

Złoto:

  • f_obs: tablica zaobserwowanych zliczeń.
  • f_exp: tablica oczekiwanych zliczeń. Domyślnie zakłada się, że każda kategoria jest równie prawdopodobna.

Poniższy kod pokazuje, jak używać tej funkcji w naszym konkretnym przykładzie:

 import scipy.stats as stats

#perform Chi-Square Goodness of Fit Test
stats.chisquare(f_obs=observed, f_exp=expected)

(statistic=4.36, pvalue=0.35947)

Statystyka testu Chi-kwadrat wynosi 4,36 , a odpowiadająca jej wartość p wynosi 0,35947 .

Należy zauważyć, że wartość p odpowiada wartości Chi-kwadrat z n-1 stopniami swobody (dof), gdzie n jest liczbą różnych kategorii. W tym przypadku dof = 5-1 = 4. Możesz użyć kalkulatora chi-kwadrat do wartości P , aby potwierdzić, że wartość p odpowiadająca X 2 = 4,36 przy dof = 4 wynosi 0,35947 .

Przypomnijmy, że test dobroci dopasowania chi-kwadrat wykorzystuje następujące hipotezy zerowe i alternatywne:

  • H 0 : (hipoteza zerowa) Zmienna ma rozkład hipotetyczny.
  • H 1 : (hipoteza alternatywna) Zmienna nie ma rozkładu hipotetycznego.

Ponieważ wartość p (0,35947) jest nie mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej. Oznacza to, że nie mamy wystarczających dowodów, aby stwierdzić, że prawdziwy rozkład klientów różni się od tego podawanego przez właściciela sklepu.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *