Jak wykonać test dopasowania chi square w programie excel
Test dobroci dopasowania chi-kwadrat służy do określenia, czy zmienna kategoryczna ma rozkład hipotetyczny.
W tym samouczku wyjaśniono, jak przeprowadzić test dobroci dopasowania chi-kwadrat w programie Excel.
Przykład: test zgodności chi-kwadrat w programie Excel
Właściciel sklepu twierdzi, że w każdym dniu tygodnia do jego sklepu przychodzi taka sama liczba klientów. Aby przetestować tę hipotezę, niezależny badacz rejestruje liczbę klientów, którzy przychodzą do sklepu w danym tygodniu i stwierdza, co następuje:
- Poniedziałek: 50 klientów
- Wtorek: 60 klientów
- Środa: 40 klientów
- Czwartek: 47 klientów
- Piątek: 53 klientów
Wykonamy poniższe kroki, aby przeprowadzić test dobroci dopasowania chi-kwadrat w celu ustalenia, czy dane są zgodne z twierdzeniem właściciela sklepu.
Krok 1: Wprowadź dane.
Najpierw w jednej kolumnie wpiszemy wartości danych dla oczekiwanej liczby klientów każdego dnia, a w drugiej obserwowanej liczby klientów każdego dnia:
Uwaga: łącznie było 250 klientów. Jeśli więc właściciel sklepu spodziewa się, że każdego dnia do sklepu wejdzie taka sama liczba klientów, będzie miał 50 klientów dziennie.
Krok 2: Znajdź różnicę między wartościami obserwowanymi i oczekiwanymi.
Statystyka testu Chi-kwadrat dla testu dobroci dopasowania wynosi X 2 = Σ(OE) 2 / E.
Złoto:
- Σ: to fantazyjny symbol oznaczający „sumę”
- O: obserwowana wartość
- E: wartość oczekiwana
Poniższy wzór pokazuje, jak obliczyć (OE) 2 /E dla każdego wiersza:
Krok 3: Oblicz statystykę testu chi-kwadrat i odpowiadającą jej wartość p.
Na koniec obliczymy statystykę testu Chi-kwadrat oraz odpowiadającą jej wartość p, korzystając z następujących wzorów:
Uwaga: Funkcja Excel CHISQ.DIST.RT(x, deg_freedom) zwraca prawidłowe prawdopodobieństwo rozkładu Chi-kwadrat powiązanego ze statystyką testową x i pewnym stopniem swobody. Stopnie swobody oblicza się jako n-1. W tym przypadku deg_freedom = 5 – 1 = 4.
Krok 4: Interpretacja wyników.
Statystyka testu X2 dla testu wynosi 4,36 , a odpowiadająca jej wartość p wynosi 0,3595 . Ponieważ ta wartość p jest nie mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej. Oznacza to, że nie mamy wystarczających dowodów, aby stwierdzić, że prawdziwy rozkład klientów różni się od tego podawanego przez właściciela sklepu.