5 przykładów wartości odstających w prawdziwym życiu
Wartość odstająca to punkt danych, który jest wyjątkowo oddalony od innych wartości w zbiorze danych.
Często definiujemy punkt danych jako wartość odstającą, jeśli jest 1,5-krotnością rozstępu międzykwartylowego powyżej trzeciego kwartyla lub 1,5-krotności rozstępu międzykwartylowego poniżej pierwszego kwartyla zbioru danych.
Uwaga : Rozstęp międzykwartylowy to różnica między trzecim kwartylem (75. percentyl) a pierwszym kwartylem (25. percentyl) zbioru danych.
Poniższe scenariusze przedstawiają przykłady wartości odstających w rzeczywistych sytuacjach.
Przykład 1: Wartości odstające w zakresie dochodów
Konkretnym scenariuszem, w którym często pojawiają się wartości odstające, jest rozkład dochodów.
Na przykład 25. percentyl (1 kwartał) rocznego dochodu w danym kraju może wynosić 15 000 dolarów rocznie, a 75. percentyl (3 kwartał) może wynosić 120 000 dolarów rocznie.
Rozstęp międzykwartylowy (IQR) zostanie obliczony w następujący sposób: 120 000 USD – 15 000 USD = 105 000 USD.
Oznacza to, że każda osoba, której dochód wykracza poza następujące limity, zostanie uznana za osobę odstającą:
- Dolny limit : I kwartał – 1,5*IQR = 15 000 USD – 1,5*105 000 USD = -142 500 USD
- Górny limit : Q3 + 1,5*IQR = 120 000 USD + 1,5*105 000 USD = 277 500 USD
Ktoś taki jak Elon Musk, którego majątek netto sięga bilionów dolarów, byłby uważany za osobę odstającą pod względem rocznego dochodu.
Uwaga : Wartość wartości odstających przekraczająca dolną granicę nie zawsze jest znacząca, na przykład nie jest możliwe uzyskanie ujemnego dochodu rocznego.
Przykład 2: Wartości odstające bezdechu
Innym rzeczywistym scenariuszem, w którym często pojawiają się wartości odstające, jest bezdech.
Na przykład 25. percentyl (Q1) określający, jak długo osoba może wstrzymać oddech, wynosi około 15 sekund, podczas gdy 75. percentyl (Q3) wynosi około 75 sekund.
Rozstęp międzykwartylowy (IQR) można obliczyć w następujący sposób: 75 – 15 = 60.
Oznacza to, że każdy, kto jest w stanie wstrzymać oddech poza następującymi limitami, zostanie uznany za osobę odstającą:
- Dolny limit : Q1 – 1,5*IQR = 15 – 1,5*60 = -75 sekund
- Górna granica : Q3 + 1,5*IQR = 75 + 1,5*60 = 165 sekund
Wszyscy freediverzy , którzy potrafią wstrzymać oddech na 10 minut lub dłużej, zostaliby uznani za osoby odstające, ponieważ potrafią wstrzymać oddech na znacznie dłużej niż 165 sekund.
Przykład 3: Wartości odstające pod względem wielkości zwierzęcia
Innym scenariuszem ze świata rzeczywistego, w którym często pojawiają się wartości odstające, jest wielkość zwierzęcia.
Na przykład 25. percentyl (Q1) wzrostu konia wynosi około 5 stóp, a 75. percentyl (Q3) wynosi około 5,5 stopy.
Rozstęp międzykwartylowy (IQR) można obliczyć w następujący sposób: 5,5 – 5 = 0,5 stopy.
Oznacza to, że każdy koń, którego wielkość wykracza poza następujące limity, zostanie uznany za odstającego:
- Dolna granica : Q1 – 1,5*IQR = 5 – 1,5*0,5 = 4,25 stopy
- Górna granica : Q3 + 1,5*IQR = 5 + 1,5*0,5 = 5,75 stopy
Według Księgi Rekordów Guinnessa rekord najwyższego konia wszechczasów wynosi nieco ponad 7 stóp. Ponieważ jest to powyżej górnej granicy 17,75 stopy, koń ten będzie wyraźnie uważany za osobnika odstającego.
Przykład 4: Wartości odstające w sprzedaży biletów do kina
Innym realnym scenariuszem, w którym często pojawiają się wartości odstające, jest sprzedaż biletów do kina.
Na przykład 25. percentyl (pierwszy kwartał) sprzedaży biletów do kina brutto wynosi około 2 miliony dolarów, a 75. percentyl (trzeci kwartał) to około 15 milionów dolarów.
Rozstęp międzykwartylowy (IQR) zostanie obliczony w następujący sposób: 15 milionów dolarów – 2 miliony dolarów = 13 milionów dolarów.
Oznacza to, że każdy film, którego sprzedaż brutto wykracza poza następujące limity, zostanie uznany za film odstający:
- Dolny limit : T1 – 1,5*IQR = 2 miliony dolarów – 1,5*13 milionów dolarów = -17,5 milionów dolarów
- Górny limit : T3 + 1,5*IQR = 15 milionów dolarów + 1,5*13 milionów dolarów = 34,5 milionów dolarów
Większość filmów z serii „Gwiezdne Wojny” zarobiła znacznie ponad 34,5 miliona dolarów, co czyni je wyjątkowymi pod względem sprzedaży biletów.
Przykład 5: Wartości odstające w liczbie punktów zdobytych na mecz
Innym obszarem świata rzeczywistego, w którym często pojawiają się wartości odstające, jest sport zawodowy.
Na przykład 25. percentyl (Q1) punktów zdobytych przez graczy NBA to około 5 punktów na mecz, a 75. percentyl (Q3) to około 15 punktów na mecz.
Rozstęp międzykwartylowy (IQR) zostanie obliczony w następujący sposób: 15 – 5 = 10 punktów.
Oznacza to, że każdy gracz, którego średnia wykracza poza następujące limity, zostanie uznany za osobę odstającą:
- Dolna granica : Q1 – 1,5*IQR = 5 – 1,5*10 = -10 punktów
- Górna granica : Q3 + 1,5*IQR = 15 + 1,5*10 = 30 punktów
W wielu sezonach NBA zawodnik z największą liczbą punktów zdobywa zazwyczaj nieco ponad 30 punktów na mecz, co czyni go odstającym graczem.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak znaleźć wartości odstające w zbiorach danych przy użyciu różnych programów statystycznych:
Jak znaleźć wartości odstające w programie Excel
Jak znaleźć wartości odstające w R
Jak znaleźć wartości odstające w Pythonie
Jak znaleźć wartości odstające w SPSS