Jak znaleźć wartości odstające za pomocą rozstępu międzykwartylowego
Wartość odstająca to obserwacja , która jest nienormalnie odległa od innych wartości w zbiorze danych. Wartości odstające mogą być problematyczne, ponieważ mogą wpływać na wyniki analizy.
Powszechnym sposobem wykrywania wartości odstających w zbiorze danych jest użycie rozstępu międzykwartylowego .
Rozstęp międzykwartylowy, często w skrócie IQR, to różnica między 25. percentylem (Q1) a 75. percentylem (Q3) w zbiorze danych. Mierzy rozkład średnich 50% wartości.
Popularną metodą jest uznanie obserwacji za wartość odstającą, jeśli ma ona wartość 1,5 razy większą od IQR lub 1,5 razy mniejszą od IQR.
W tym samouczku przedstawiono krok po kroku przykład znajdowania wartości odstających w zestawie danych przy użyciu tej metody.
Krok 1: Utwórz dane
Załóżmy, że mamy następujący zbiór danych:
Krok 2: Zidentyfikuj pierwszy i trzeci kwartyl
Pierwszy kwartyl wynosi 5 , a trzeci kwartyl wynosi 20,75 .
Zatem rozstęp międzykwartylowy okazuje się wynosić 20,75 -5 = 15,75 .
Krok 3: Znajdź dolną i górną granicę
Dolną granicę oblicza się w następujący sposób:
Dolna granica = Q1 – 1,5*IQR = 5 – 1,5*15,75 = -18,625
Górną granicę oblicza się w następujący sposób:
Górna granica = Q3 + 1,5*IQR = 20,75 + 1,5*15,75 = 44,375
Krok 4: Zidentyfikuj wartości odstające
Jedyną obserwacją w zbiorze danych z wartością poniżej dolnej granicy lub powyżej górnej granicy jest 46 . Jest to zatem jedyna wartość odstająca w tym zbiorze danych.
Uwaga: możesz użyć tego kalkulatora granic wartości odstających, aby automatycznie znaleźć górną i dolną granicę wartości odstających w danym zbiorze danych.
Jak znaleźć wartości odstające w praktyce
Poniższe samouczki wyjaśniają, jak znaleźć wartości odstające przy użyciu rozstępu międzykwartylowego w różnych programach statystycznych:
Jak znaleźć wartości odstające w Excelu
Jak znaleźć wartości odstające w R
Jak znaleźć wartości odstające w Pythonie
Jak znaleźć wartości odstające w SPSS