Dlaczego tryb jest ważny w statystykach?
Tryb reprezentuje wartość, która pojawia się najczęściej w zestawie danych.
Zbiór danych nie może mieć żadnych trybów (jeśli żadne wartości się nie powtarzają), jednego trybu lub wielu trybów.
Na przykład tryb w następującym zbiorze danych to 19:
Zbiór danych: 3, 4, 11, 15, 19 , 19, 19 , 22 , 22, 23, 23, 26
Jest to wartość, która pojawia się najczęściej.
W statystykach tryb jest ważny z następujących powodów:
Powód 1 : Dzięki temu wiemy, które wartości w zestawie danych są najczęstsze.
Powód 2 : Przydaje się do znalezienia najczęstszej wartości w danych kategorycznych, gdy nie można obliczyć średniej i mediany.
Powód 3 : Daje nam wyobrażenie o tym, gdzie znajduje się „środek” zbioru danych, mimo że częściej stosuje się medianę i średnią (jak zobaczymy w dalszej części tego artykułu).
Poniższe przykłady ilustrują każdy z tych powodów w praktyce.
Powód 1: Tryb mówi nam, która wartość jest najczęstsza
Załóżmy, że mamy zbiór danych składający się ze 100 000 wierszy zawierających ceny sprzedaży domów w Stanach Zjednoczonych:
Załóżmy, że używamy oprogramowania statystycznego (takiego jak Excel , R , Python itp.) do obliczenia trybu tego zbioru danych i stwierdzamy, że istnieją trzy tryby:
- 280 000 dolarów
- 300 000 dolarów
- 305 000 dolarów
To natychmiast daje nam wyobrażenie o najpopularniejszych cenach domów w zbiorze danych.
Obliczanie trybu tysięcy jest również znacznie szybsze niż przeglądanie wierszy danych i próba określenia, które ceny domów występują najczęściej.
Powód 2: Tryb wyszukuje najczęstszą wartość w danych kategorycznych
Załóżmy, że mamy zbiór danych składający się z 1000 wierszy, który informuje nas o kolorze samochodu należącego do osób w określonej okolicy:
Zmienna „kolor” jest zmienną kategoryczną , co oznacza, że wartości należą do kategorii („czerwony”, „żółty”, „czarny” itp.) i dlatego nie możemy obliczyć wartości ilościowej, takiej jak średnia lub mediana .
Możemy jednak obliczyć modę, ponieważ po prostu reprezentuje ona najczęstszą wartość w zbiorze danych.
Na przykład możemy użyć oprogramowania statystycznego, aby określić, że tryb tego zbioru danych jest „czarny”, co oznacza, że najpopularniejszym kolorem samochodu w tym zbiorze danych jest czarny.
Powód 3: Tryb daje nam pojęcie, gdzie znajduje się środek zbioru danych
Tryb jest również uważany za miarę tendencji centralnej , co oznacza, że może dać nam wyobrażenie o tym, gdzie znajduje się „środek” zbioru danych.
Załóżmy na przykład, że mamy następujący zbiór danych przedstawiający wyniki egzaminów 20 różnych uczniów w klasie:
Tryb okazuje się wynosić 82 – to najczęstszy wynik egzaminu. Okazuje się to również dobrym wskaźnikiem tego, gdzie w tym zbiorze danych znajduje się „podstawowa” wartość wyniku recenzji.
Załóżmy jednak, że zamiast tego mamy następujący zbiór danych z wynikami egzaminów:
W tym zbiorze danych 72 to wynik egzaminu z mody. Okazuje się jednak, że słabo wskazuje to, gdzie leży „podstawowy” wynik egzaminu.
Średni wynik egzaminu to 82,9 , a średni wynik egzaminu to 82,5 , co daje nam lepszy obraz tego, gdzie leży „centralna” wartość w odniesieniu do mody.
Streszczenie
Oto krótkie podsumowanie głównych punktów poruszonych w tym artykule:
- Tryb reprezentuje wartości, które pojawiają się najczęściej w zestawie danych.
- Tryb informuje nas o najczęstszej wartości w danych kategorycznych, gdy nie można zastosować średniej i mediany.
- Tryb daje nam wyobrażenie o tym, gdzie znajduje się „środek” zbioru danych, ale może wprowadzać w błąd w porównaniu ze średnią lub medianą.
Dodatkowe zasoby
Poniższe samouczki zawierają dodatkowe informacje na temat średniej, mediany i trybu w statystykach:
Dlaczego średnia jest ważna w statystyce?
Dlaczego mediana jest ważna w statystyce?
Konkretne przykłady: użycie średniej, mediany i trybu
Kiedy stosować średnią vs. Mediana: z przykładami