Jak uruchomić tester grubbsa w excelu
Test Grubbsa to test statystyczny, który można zastosować do zidentyfikowania obecności wartości odstającej w zbiorze danych. Aby skorzystać z tego testu, analizowany zbiór danych musi mieć w przybliżeniu rozkład normalny i, w idealnym przypadku, musi zawierać co najmniej 7 obserwacji.
Uwaga: Jeśli uważasz, że w zbiorze danych znajduje się wiele wartości odstających, powinieneś zamiast tego zastosować uogólniony test skrajnych luk ucznia dla wartości odstających .
Jeśli uważasz, że maksymalna wartość w zbiorze danych jest wartością odstającą, statystykę testową oblicza się w następujący sposób:
G = (x maks. – x ) / s
Jeśli uważasz, że minimalna wartość w zbiorze danych jest wartością odstającą, statystykę testową oblicza się w następujący sposób:
G = ( x – x min ) / s
A jeśli nie masz pewności, czy wartość maksymalna, czy minimalna zbioru danych jest wartością odstającą i chcesz przeprowadzić test dwustronny, statystykę testową oblicza się w następujący sposób:
G = max|x i – x | /S
gdzie x to średnia próbki, a s to odchylenie standardowe próbki.
Wartość krytyczną testu oblicza się w następujący sposób:
G krytyczny = (n-1)t krytyczny / √[n(n-2 + t 2 krytyczny )]
gdzie t krytyczny jest wartością krytyczną rozkładu t z n-2 stopniami swobody, a poziom istotności wynosi α/n dla testu jednostronnego i α/(2n) dla testu dwustronnego.
Przykład: test Grubbsa w Excelu
Określ, czy wartość 60 jest wartością odstającą w następującym zbiorze danych:
Krok 1: Najpierw musimy upewnić się, że dane mają w przybliżeniu rozkład normalny. W tym celu możemy utworzyć histogram, aby sprawdzić, czy rozkład ma w przybliżeniu kształt dzwonu. Poniższy zrzut ekranu pokazuje, jak utworzyć histogram w programie Excel przy użyciu pakietu narzędzi do analizy danych :
Z histogramu widać, że dane mają w przybliżeniu rozkład normalny. Oznacza to, że możemy przeprowadzić test Grubbsa.
Krok 2: Następnie przeprowadzimy test Grubbsa, aby ustalić, czy wartość 60 jest rzeczywiście wartością odstającą w zbiorze danych. Poniższy zrzut ekranu pokazuje formuły, których należy użyć do wykonania testu Grubbsa:
Statystyka testowa G w komórce D4 wynosi 3,603219 .
Wartość krytyczna G krytyczna w komórce D11 wynosi 2,556581 . Ponieważ statystyka testowa jest większa niż wartość krytyczna, oznacza to, że wartość 60 jest rzeczywiście wartością odstającą w tym zbiorze danych.
Co zrobić, jeśli zostanie zidentyfikowana wartość odstająca
Jeśli test Grubbsa wykryje w Twoim zbiorze danych wartość odstającą, masz kilka możliwości:
- Sprawdź dwukrotnie, aby upewnić się, że wartość nie jest literówką lub błędem przy wprowadzaniu danych. Czasami wartości pojawiające się w zbiorach danych jako wartości odstające są po prostu literówkami popełnionymi przez osobę podczas wprowadzania danych. Przed podjęciem dalszych decyzji wróć i sprawdź, czy wartość została wprowadzona poprawnie.
- Przypisz nową wartość do wartości odstającej . Jeśli okaże się, że wartość odstająca wynika z literówki lub błędu przy wprowadzaniu danych, możesz zdecydować się na przypisanie jej nowej wartości, takiej jak średnia lub mediana zbioru danych.
- Usuń wartość odstającą. Jeśli wartość rzeczywiście odbiega od normy, możesz ją usunąć, jeśli będzie miała znaczący wpływ na ogólną analizę.
Bez względu na to, co zdecydujesz się zrobić z wartością odstającą, pamiętaj o tym, przedstawiając końcowe wnioski z analizy.