Jak znaleźć wartości odstające za pomocą rozstępu międzykwartylowego


Wartość odstająca to obserwacja , która jest nienormalnie odległa od innych wartości w zbiorze danych. Wartości odstające mogą być problematyczne, ponieważ mogą wpływać na wyniki analizy.

Powszechnym sposobem wykrywania wartości odstających w zbiorze danych jest użycie rozstępu międzykwartylowego .

Rozstęp międzykwartylowy, często w skrócie IQR, to różnica między 25. percentylem (Q1) a 75. percentylem (Q3) w zbiorze danych. Mierzy rozkład średnich 50% wartości.

Popularną metodą jest uznanie obserwacji za wartość odstającą, jeśli ma ona wartość 1,5 razy większą od IQR lub 1,5 razy mniejszą od IQR.

Znajdowanie wartości odstających za pomocą IQR

W tym samouczku przedstawiono krok po kroku przykład znajdowania wartości odstających w zestawie danych przy użyciu tej metody.

Krok 1: Utwórz dane

Załóżmy, że mamy następujący zbiór danych:

Krok 2: Zidentyfikuj pierwszy i trzeci kwartyl

Pierwszy kwartyl wynosi 5 , a trzeci kwartyl wynosi 20,75 .

Zatem rozstęp międzykwartylowy okazuje się wynosić 20,75 -5 = 15,75 .

Krok 3: Znajdź dolną i górną granicę

Dolną granicę oblicza się w następujący sposób:

Dolna granica = Q1 – 1,5*IQR = 5 – 1,5*15,75 = -18,625

Górną granicę oblicza się w następujący sposób:

Górna granica = Q3 + 1,5*IQR = 20,75 + 1,5*15,75 = 44,375

Znajdowanie wartości odstających metodą IQR

Krok 4: Zidentyfikuj wartości odstające

Jedyną obserwacją w zbiorze danych z wartością poniżej dolnej granicy lub powyżej górnej granicy jest 46 . Jest to zatem jedyna wartość odstająca w tym zbiorze danych.

Przykład znajdowania wartości odstających za pomocą rozstępu międzykwartylowego

Uwaga: możesz użyć tego kalkulatora granic wartości odstających, aby automatycznie znaleźć górną i dolną granicę wartości odstających w danym zbiorze danych.

Jak znaleźć wartości odstające w praktyce

Poniższe samouczki wyjaśniają, jak znaleźć wartości odstające przy użyciu rozstępu międzykwartylowego w różnych programach statystycznych:

Jak znaleźć wartości odstające w Excelu
Jak znaleźć wartości odstające w R
Jak znaleźć wartości odstające w Pythonie
Jak znaleźć wartości odstające w SPSS

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *