Test chi-kwadrat
W tym artykule wyjaśniono, czym jest test chi-kwadrat w statystyce i do czego się go używa. Dowiesz się także jak wykonać test chi-kwadrat oraz dodatkowo rozwiązane ćwiczenie krok po kroku.
Co to jest test chi-kwadrat?
Test Chi-kwadrat jest testem statystycznym stosowanym w celu ustalenia, czy istnieje statystycznie istotna różnica między częstotliwością oczekiwaną a częstotliwością obserwowaną.
Logicznie rzecz biorąc, statystyka testu chi-kwadrat ma rozkład chi-kwadrat . Wartość statystyki testowej należy zatem porównać z konkretną wartością rozkładu chi-kwadrat. Poniżej zobaczymy, jak przeprowadzany jest test chi-kwadrat.
Ten typ testu statystycznego jest również znany jako test chi-kwadrat Pearsona i czasami jest reprezentowany przez symbol rozkładu chi-kwadrat: test χ² .
Wzór testu chi-kwadrat
Statystyka testu chi-kwadrat jest równa sumie kwadratów różnic między wartościami obserwowanymi i wartościami oczekiwanymi podzielonej przez wartości oczekiwane.
Zatem wzór na test chi-kwadrat jest następujący:
Złoto:
-
jest statystyką testu chi-kwadrat, która jest zgodna z rozkładem chi-kwadrat
stopnie swobody.
-
to wielkość próbki danych.
-
jest obserwowaną wartością danych, tj.
-
jest oczekiwaną wartością danych, tj.
Hipotezą zerową hipotezy testującej test chi-kwadrat jest to, że zaobserwowane wartości są równoważne wartościom oczekiwanym. Natomiast alternatywną hipotezą testu jest to, że jedna z obserwowanych wartości różni się od wartości oczekiwanej.
Biorąc pod uwagę poziom znaczenia
, obliczoną statystykę testową należy porównać z krytyczną wartością testową, aby określić, czy odrzucić hipotezę zerową, czy hipotezę alternatywną:
- Jeśli statystyka testowa jest mniejsza niż wartość krytyczna
, hipoteza alternatywna zostaje odrzucona (i przyjęta zostaje hipoteza zerowa).
- Jeśli statystyka testowa jest większa niż wartość krytyczna
, hipoteza zerowa zostaje odrzucona (i przyjęta zostaje hipoteza alternatywna).
Przykład testu chi-kwadrat
Kiedy już zapoznaliśmy się z definicją testu chi-kwadrat i jaki jest jego wzór, poniżej przedstawiono rozwiązany krok po kroku przykład, dzięki czemu można zobaczyć, jak przeprowadza się tego typu test statystyczny.
- Właściciel sklepu twierdzi, że 50% jego sprzedaży dotyczy produktu A, 35% jego sprzedaży dotyczy produktu B, a 15% jego sprzedaży dotyczy produktu C. Jednakże sprzedane jednostki każdego produktu to te, w których są prezentowane w poniższej tabeli awaryjnej . Przeanalizuj, czy dane teoretyczne właściciela różnią się statystycznie od danych faktycznie zebranych.
Produkt | Zaobserwowana sprzedaż (O i ) |
---|---|
Produkt A | 453 |
Produkt B | 268 |
Produkt C | 79 |
Całkowity | 800 |
Najpierw musimy obliczyć wartości oczekiwane przez właściciela sklepu. W tym celu mnożymy procent oczekiwanej sprzedaży każdego produktu przez liczbę osiągniętej sprzedaży całkowitej:
Dlatego tabela rozkładu częstotliwości problemu jest następująca:
Produkt | Zaobserwowana sprzedaż (O i ) | Oczekiwana sprzedaż (E i ) |
---|---|---|
Produkt A | 453 | 400 |
Produkt B | 268 | 280 |
Produkt C | 79 | 120 |
Całkowity | 800 | 800 |
Teraz, gdy obliczyliśmy wszystkie wartości, stosujemy wzór testu chi-kwadrat do obliczenia statystyki testowej:
Po obliczeniu wartości statystyki testowej używamy tabeli rozkładu chi-kwadrat, aby znaleźć wartość krytyczną testu. Rozkład chi-kwadrat ma
stopni swobody, więc jeśli wybierzemy poziom istotności
wartość krytyczna testu jest następująca:
Zatem statystyka testowa (21,53) jest większa od krytycznej wartości testowej (5,991), dlatego hipotezę zerową odrzuca się i przyjmuje hipotezę alternatywną. Oznacza to, że dane są bardzo różne i dlatego właściciel sklepu spodziewał się innej sprzedaży niż faktycznie zrealizowana.
Interpretacja testu chi-kwadrat
Interpretacji testu Chi-kwadrat nie można dokonać wyłącznie na podstawie uzyskanego wyniku testu, ale należy go porównać z wartością krytyczną testu.
Logicznie rzecz biorąc, im mniejsza wartość obliczonej statystyki testowej, tym bardziej podobne są dane zaobserwowane do danych oczekiwanych. Jeśli więc wynik testu chi-kwadrat wynosi 0, oznacza to, że wartości obserwowane i wartości oczekiwane są dokładnie takie same. Natomiast im większy wynik testu, tym bardziej zaobserwowane wartości różnią się od oczekiwanych.
Aby jednak zdecydować, czy te dwa zbiory danych są statystycznie różne czy równe, należy porównać obliczoną wartość testową z krytyczną wartością testową, aby odrzucić hipotezę zerową lub alternatywną hipotezę kontrastu. Jeżeli statystyka testowa jest mniejsza niż wartość krytyczna rozkładu, hipoteza alternatywna zostaje odrzucona. Z drugiej strony, jeżeli statystyka testowa jest większa od wartości krytycznej rozkładu, hipoteza zerowa zostaje odrzucona.