Dlaczego tryb jest ważny w statystykach?


Tryb reprezentuje wartość, która pojawia się najczęściej w zestawie danych.

Zbiór danych nie może mieć żadnych trybów (jeśli żadne wartości się nie powtarzają), jednego trybu lub wielu trybów.

Na przykład tryb w następującym zbiorze danych to 19:

Zbiór danych: 3, 4, 11, 15, 19 , 19, 19 , 22 , 22, 23, 23, 26

Jest to wartość, która pojawia się najczęściej.

W statystykach tryb jest ważny z następujących powodów:

Powód 1 : Dzięki temu wiemy, które wartości w zestawie danych są najczęstsze.

Powód 2 : Przydaje się do znalezienia najczęstszej wartości w danych kategorycznych, gdy nie można obliczyć średniej i mediany.

Powód 3 : Daje nam wyobrażenie o tym, gdzie znajduje się „środek” zbioru danych, mimo że częściej stosuje się medianę i średnią (jak zobaczymy w dalszej części tego artykułu).

Poniższe przykłady ilustrują każdy z tych powodów w praktyce.

Powód 1: Tryb mówi nam, która wartość jest najczęstsza

Załóżmy, że mamy zbiór danych składający się ze 100 000 wierszy zawierających ceny sprzedaży domów w Stanach Zjednoczonych:

Załóżmy, że używamy oprogramowania statystycznego (takiego jak Excel , R , Python itp.) do obliczenia trybu tego zbioru danych i stwierdzamy, że istnieją trzy tryby:

  • 280 000 dolarów
  • 300 000 dolarów
  • 305 000 dolarów

To natychmiast daje nam wyobrażenie o najpopularniejszych cenach domów w zbiorze danych.

Obliczanie trybu tysięcy jest również znacznie szybsze niż przeglądanie wierszy danych i próba określenia, które ceny domów występują najczęściej.

Powód 2: Tryb wyszukuje najczęstszą wartość w danych kategorycznych

Załóżmy, że mamy zbiór danych składający się z 1000 wierszy, który informuje nas o kolorze samochodu należącego do osób w określonej okolicy:

Zmienna „kolor” jest zmienną kategoryczną , co oznacza, że wartości należą do kategorii („czerwony”, „żółty”, „czarny” itp.) i dlatego nie możemy obliczyć wartości ilościowej, takiej jak średnia lub mediana .

Możemy jednak obliczyć modę, ponieważ po prostu reprezentuje ona najczęstszą wartość w zbiorze danych.

Na przykład możemy użyć oprogramowania statystycznego, aby określić, że tryb tego zbioru danych jest „czarny”, co oznacza, że najpopularniejszym kolorem samochodu w tym zbiorze danych jest czarny.

Powód 3: Tryb daje nam pojęcie, gdzie znajduje się środek zbioru danych

Tryb jest również uważany za miarę tendencji centralnej , co oznacza, że może dać nam wyobrażenie o tym, gdzie znajduje się „środek” zbioru danych.

Załóżmy na przykład, że mamy następujący zbiór danych przedstawiający wyniki egzaminów 20 różnych uczniów w klasie:

Tryb okazuje się wynosić 82 – to najczęstszy wynik egzaminu. Okazuje się to również dobrym wskaźnikiem tego, gdzie w tym zbiorze danych znajduje się „podstawowa” wartość wyniku recenzji.

Załóżmy jednak, że zamiast tego mamy następujący zbiór danych z wynikami egzaminów:

W tym zbiorze danych 72 to wynik egzaminu z mody. Okazuje się jednak, że słabo wskazuje to, gdzie leży „podstawowy” wynik egzaminu.

Średni wynik egzaminu to 82,9 , a średni wynik egzaminu to 82,5 , co daje nam lepszy obraz tego, gdzie leży „centralna” wartość w odniesieniu do mody.

Streszczenie

Oto krótkie podsumowanie głównych punktów poruszonych w tym artykule:

  • Tryb reprezentuje wartości, które pojawiają się najczęściej w zestawie danych.
  • Tryb informuje nas o najczęstszej wartości w danych kategorycznych, gdy nie można zastosować średniej i mediany.
  • Tryb daje nam wyobrażenie o tym, gdzie znajduje się „środek” zbioru danych, ale może wprowadzać w błąd w porównaniu ze średnią lub medianą.

Dodatkowe zasoby

Poniższe samouczki zawierają dodatkowe informacje na temat średniej, mediany i trybu w statystykach:

Dlaczego średnia jest ważna w statystyce?
Dlaczego mediana jest ważna w statystyce?
Konkretne przykłady: użycie średniej, mediany i trybu
Kiedy stosować średnią vs. Mediana: z przykładami

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *