Kompletny przewodnik: jak sprawdzić założenia manova
MANOVA (wieloczynnikowa analiza wariancji) służy do analizy, w jaki sposób jedna lub więcej zmiennych czynnikowych wpływa na wiele zmiennych odpowiedzi.
Na przykład moglibyśmy użyć MANOVA do analizy, jak poziom wykształcenia (dyplom szkoły średniej, stopień naukowy, tytuł licencjata, tytuł magistra) wpływa zarówno na roczny dochód, jak i całkowite zadłużenie z tytułu kredytów studenckich.
Powiązane: Różnice między ANOVA, ANCOVA, MANOVA i MANCOVA
Za każdym razem, gdy wykonujemy MANOVA, musimy sprawdzić, czy spełnione są następujące założenia:
1. Wielowymiarowa normalność – zmienne odpowiedzi mają wielowymiarowy rozkład normalny w każdej grupie zmiennych czynnikowych.
2. Niezależność – każda obserwacja jest losowo i niezależnie pobierana z populacji.
3. Równa wariancja – macierze kowariancji populacji każdej grupy są równe.
4. Brak wielowymiarowych wartości odstających – nie ma skrajnych wielowymiarowych wartości odstających.
W tym artykule przedstawiamy wyjaśnienie każdego założenia, a także sposób ustalenia, czy założenie jest spełnione.
Założenie 1: Wielowymiarowa normalność
MANOVA zakłada, że zmienne odpowiedzi mają wielowymiarowy rozkład normalny w każdej grupie zmiennej czynnikowej.
Jeżeli dla każdej kombinacji czynnik + zmienna odpowiedzi przypada co najmniej 20 obserwacji, wówczas możemy założyć, że spełnione jest założenie o wielowymiarowej normalności.
Jeżeli dla każdej kombinacji czynnik*zmienna odpowiedzi jest mniej niż 20 obserwacji, możemy utworzyć macierz wykresu rozrzutu w celu wizualizacji reszt i wizualnego sprawdzenia, czy to założenie jest spełnione.
Na szczęście powszechnie wiadomo, że MANOVA jest odporna na odchylenia od normalności wielowymiarowej, więc małe lub umiarkowane odchylenia na ogół nie stanowią problemu.
Hipoteza 2: Niepodległość
MANOVA zakłada, że każda obserwacja jest losowo i niezależnie pobierana z populacji.
Dopóki do zbierania danych stosowana jest metoda doboru probabilistycznego (każdy członek populacji ma równe prawdopodobieństwo znalezienia się w próbie), możemy założyć, że każda obserwacja została dobrana w sposób losowy i niezależny.
Przykłady metod próbkowania prawdopodobieństwa obejmują:
- Proste losowe pobieranie próbek
- Losowe pobieranie warstwowe
- Losowe próbkowanie klastrów
- Systematyczne pobieranie próbek losowych
Założenie 3: równa wariancja
MANOVA zakłada, że macierze kowariancji populacji każdej grupy są równe.
Najczęstszym sposobem sprawdzenia tej hipotezy jest użycie testu M Boxa. Wiadomo, że test ten jest dość rygorystyczny, dlatego zazwyczaj stosujemy poziom istotności 0,001, aby określić, czy macierze kowariancji populacji są równe, czy nie.
Jeżeli wartość p testu M Boxa jest większa niż 0,001, możemy założyć, że to założenie jest spełnione.
Na szczęście, nawet jeśli wartość p testu jest mniejsza niż 0,001, MANOVA jest zwykle odporna na odchylenia od tej hipotezy.
Aby nierówne macierze kowariancji stanowiły problem, różnice między macierzami kowariancji muszą być dość ekstremalne.
Hipoteza 4: brak wielowymiarowych wartości odstających
MANOVA zakłada, że w danych nie występują skrajne wielowymiarowe wartości odstające, które mogłyby znacząco wpłynąć na wyniki.
Najczęstszym sposobem sprawdzenia tego założenia jest obliczenie dla każdej obserwacji odległości Mahalanobisa, która reprezentuje odległość między dwoma punktami w przestrzeni wielowymiarowej.
Jeśli odpowiadająca wartość p dla odległości Mahalanobisa obserwacji jest mniejsza niż 0,001, ogólnie stwierdzamy, że obserwacja ta jest skrajną wartością odstającą.
Zapoznaj się z poniższymi tutorialami, aby dowiedzieć się, jak obliczyć odległość Mahalanobisa w różnych programach statystycznych:
- Jak obliczyć odległość Mahalanobisa w R
- Jak obliczyć odległość Mahalanobisa w SPSS
- Jak obliczyć odległość Mahalanobisa w Pythonie
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonać MANOVA w różnych programach statystycznych:
Jak wykonać MANOVA w R
Jak wykonać MANOVA w SPSS
Jak wykonać MANOVA w Stata