Jak wykonać test dobroci dopasowania chi-kwadrat w r


Test dobroci dopasowania chi-kwadrat służy do określenia, czy zmienna kategoryczna ma rozkład hipotetyczny.

W tym samouczku wyjaśniono, jak wykonać test dobroci dopasowania chi-kwadrat w języku R.

Przykład: test dobroci dopasowania chi-kwadrat w R

Właściciel sklepu twierdzi, że w każdym dniu tygodnia do jego sklepu przychodzi taka sama liczba klientów. Aby przetestować tę hipotezę, badacz rejestruje liczbę klientów, którzy przychodzą do sklepu w danym tygodniu i stwierdza, co następuje:

  • Poniedziałek: 50 klientów
  • Wtorek: 60 klientów
  • Środa: 40 klientów
  • Czwartek: 47 klientów
  • Piątek: 53 klientów

Wykonaj poniższe kroki, aby przeprowadzić test dobroci dopasowania chi-kwadrat w języku R w celu ustalenia, czy dane są zgodne z twierdzeniem właściciela sklepu.

Krok 1: Utwórz dane.

Najpierw utworzymy dwie tabele zawierające zaobserwowane częstotliwości i oczekiwaną proporcję klientów na każdy dzień:

 observed <- c(50, 60, 40, 47, 53) 
expected <- c(.2, .2, .2, .2, .2) #must add up to 1

Krok 2: Wykonaj test dobroci dopasowania chi-kwadrat.

Następnie możemy wykonać test dopasowania chi-kwadrat za pomocą funkcji chisq.test() , która wykorzystuje następującą składnię:

chisq.test(x, p)

Złoto:

  • x: Wektor liczbowy obserwowanych częstotliwości.
  • p: wektor liczbowy o oczekiwanych proporcjach.

Poniższy kod pokazuje, jak używać tej funkcji w naszym przykładzie:

 #perform Chi-Square Goodness of Fit Test
chisq.test(x=observed, p=expected)

	Chi-squared test for given probabilities

data: observed
X-squared = 4.36, df = 4, p-value = 0.3595

Statystyka testu Chi-kwadrat wynosi 4,36 , a odpowiadająca jej wartość p wynosi 0,3595 .

Należy zauważyć, że wartość p odpowiada wartości Chi-kwadrat z n-1 stopniami swobody (dof), gdzie n jest liczbą różnych kategorii. W tym przypadku df = 5-1 = 4.

Możesz użyć kalkulatora wartości chi-kwadrat do wartości P, aby potwierdzić, że wartość p odpowiadająca X 2 = 4,36 przy df = 4 wynosi 0,35947 .

Przypomnijmy, że test dobroci dopasowania chi-kwadrat wykorzystuje następujące hipotezy zerowe i alternatywne:

  • H 0 : (hipoteza zerowa) Zmienna ma rozkład hipotetyczny.
  • H 1 : (hipoteza alternatywna) Zmienna nie ma rozkładu hipotetycznego.

Ponieważ wartość p (0,35947) jest nie mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej. Oznacza to, że nie mamy wystarczających dowodów, aby stwierdzić, że prawdziwy rozkład klientów różni się od tego podawanego przez właściciela sklepu.

Dodatkowe zasoby

Jak wykonać test niezależności chi-kwadrat w R
Jak obliczyć wartość P statystyki chi-kwadrat w R
Jak znaleźć krytyczną wartość chi-kwadrat w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *