Jak uruchomić tester grubbsa w excelu


Test Grubbsa to test statystyczny, który można zastosować do zidentyfikowania obecności wartości odstającej w zbiorze danych. Aby skorzystać z tego testu, analizowany zbiór danych musi mieć w przybliżeniu rozkład normalny i, w idealnym przypadku, musi zawierać co najmniej 7 obserwacji.

Uwaga: Jeśli uważasz, że w zbiorze danych znajduje się wiele wartości odstających, powinieneś zamiast tego zastosować uogólniony test skrajnych luk ucznia dla wartości odstających .

Jeśli uważasz, że maksymalna wartość w zbiorze danych jest wartością odstającą, statystykę testową oblicza się w następujący sposób:

G = (x maks.x ) / s

Jeśli uważasz, że minimalna wartość w zbiorze danych jest wartością odstającą, statystykę testową oblicza się w następujący sposób:

G = ( x – x min ) / s

A jeśli nie masz pewności, czy wartość maksymalna, czy minimalna zbioru danych jest wartością odstającą i chcesz przeprowadzić test dwustronny, statystykę testową oblicza się w następujący sposób:

G = max|x ix | /S

gdzie x to średnia próbki, a s to odchylenie standardowe próbki.

Wartość krytyczną testu oblicza się w następujący sposób:

G krytyczny = (n-1)t krytyczny / √[n(n-2 + t 2 krytyczny )]

gdzie t krytyczny jest wartością krytyczną rozkładu t z n-2 stopniami swobody, a poziom istotności wynosi α/n dla testu jednostronnego i α/(2n) dla testu dwustronnego.

Przykład: test Grubbsa w Excelu

Określ, czy wartość 60 jest wartością odstającą w następującym zbiorze danych:

Krok 1: Najpierw musimy upewnić się, że dane mają w przybliżeniu rozkład normalny. W tym celu możemy utworzyć histogram, aby sprawdzić, czy rozkład ma w przybliżeniu kształt dzwonu. Poniższy zrzut ekranu pokazuje, jak utworzyć histogram w programie Excel przy użyciu pakietu narzędzi do analizy danych :

Z histogramu widać, że dane mają w przybliżeniu rozkład normalny. Oznacza to, że możemy przeprowadzić test Grubbsa.

Histogram w Excelu

Krok 2: Następnie przeprowadzimy test Grubbsa, aby ustalić, czy wartość 60 jest rzeczywiście wartością odstającą w zbiorze danych. Poniższy zrzut ekranu pokazuje formuły, których należy użyć do wykonania testu Grubbsa:

Statystyka testowa G w komórce D4 wynosi 3,603219 .

Wartość krytyczna G krytyczna w komórce D11 wynosi 2,556581 . Ponieważ statystyka testowa jest większa niż wartość krytyczna, oznacza to, że wartość 60 jest rzeczywiście wartością odstającą w tym zbiorze danych.

Co zrobić, jeśli zostanie zidentyfikowana wartość odstająca

Jeśli test Grubbsa wykryje w Twoim zbiorze danych wartość odstającą, masz kilka możliwości:

  • Sprawdź dwukrotnie, aby upewnić się, że wartość nie jest literówką lub błędem przy wprowadzaniu danych. Czasami wartości pojawiające się w zbiorach danych jako wartości odstające są po prostu literówkami popełnionymi przez osobę podczas wprowadzania danych. Przed podjęciem dalszych decyzji wróć i sprawdź, czy wartość została wprowadzona poprawnie.
  • Przypisz nową wartość do wartości odstającej . Jeśli okaże się, że wartość odstająca wynika z literówki lub błędu przy wprowadzaniu danych, możesz zdecydować się na przypisanie jej nowej wartości, takiej jak średnia lub mediana zbioru danych.
  • Usuń wartość odstającą. Jeśli wartość rzeczywiście odbiega od normy, możesz ją usunąć, jeśli będzie miała znaczący wpływ na ogólną analizę.

Bez względu na to, co zdecydujesz się zrobić z wartością odstającą, pamiętaj o tym, przedstawiając końcowe wnioski z analizy.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *