Niezgrupowany rozkład częstotliwości: definicja i przykład


Załóżmy, że przeprowadzamy ankietę, w której pytamy 15 gospodarstw domowych, ile zwierząt mają w domu. Wyniki są następujące:

1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 5, 5, 6, 7, 8

Jednym ze sposobów podsumowania tych wyników jest utworzenie rozkładu częstotliwości , który mówi nam, jak często różne wartości pojawiają się w zbiorze danych.

Często korzystamy z klastrowych rozkładów częstotliwości , w których tworzymy grupy wartości, a następnie podsumowujemy liczbę obserwacji w zbiorze danych, które należą do tych grup.

Oto przykład pogrupowanego rozkładu częstotliwości dla danych z naszej ankiety:

Najpierw utworzyliśmy grupy o rozmiarze 2, a następnie policzyliśmy liczbę pojedynczych obserwacji ze zbioru danych należących do każdej grupy. Na przykład:

  • W 7 rodzinach było 1 lub 2 zwierzęta
  • 3 rodziny miały 3 lub 4 zwierzęta
  • 3 rodziny miały 5 lub 6 zwierząt
  • W 2 rodzinach było 7 lub 8 zwierząt

Innym rodzajem rozkładu częstotliwości, jaki moglibyśmy stworzyć, jest rozkład częstotliwości niezgrupowany , w którym wyświetlana jest częstotliwość każdej pojedynczej wartości danych, a nie grup wartości danych.

Oto przykład nieklastrowanego rozkładu częstotliwości dla naszych danych ankietowych:

Przykład niezgrupowanego rozkładu częstotliwości

Ten rodzaj rozkładu częstotliwości pozwala nam bezpośrednio zobaczyć, jak często w naszym zbiorze danych występowały różne wartości. Na przykład:

  • 4 rodziny miały 1 zwierzę
  • 3 rodziny miały 2 zwierzęta
  • 2 rodziny miały 3 zwierzęta
  • 1 rodzina miała 4 zwierzęta

I tak dalej.

Kiedy stosować niezgrupowane rozkłady częstotliwości

Niezgrupowane rozkłady częstotliwości mogą być przydatne, gdy chcesz zobaczyć, jak często każda pojedyncza wartość pojawia się w zbiorze danych.

Należy pamiętać, że nieklastrowane rozkłady częstotliwości najlepiej sprawdzają się w przypadku małych zbiorów danych, w których występuje tylko kilka unikalnych wartości.

Na przykład w naszych poprzednich danych z ankiety było tylko 8 unikalnych wartości, więc sensowne było utworzenie nieklastrowanego rozkładu częstotliwości.

Gdybyśmy jednak mieli tysiące zestawów danych zawierających setki lub unikalne wartości, nieklastrowany rozkład częstotliwości byłby niezwykle czasochłonny i trudny do zebrania informacji.

W przypadku większych zbiorów danych sensowne jest skonstruowanie pogrupowanych rozkładów częstotliwości.

Jak wizualizować niezgrupowane rozkłady częstotliwości

Najprostszym sposobem wizualizacji wartości w niezgrupowanym rozkładzie częstotliwości jest utworzenie wielokąta częstotliwości , który wyświetla częstotliwości każdej pojedynczej wartości na prostym wykresie.

Oto jak wyglądałby wielokąt częstotliwości dla naszych przykładowych danych:

Wielokąt częstotliwości dla niezgrupowanego rozkładu częstotliwości

Pomaga nam to szybko zrozumieć, jak często każda wartość pojawia się w zbiorze danych.

Alternatywnie możemy utworzyć wykres słupkowy , aby wyświetlić dokładnie te same dane za pomocą słupków, a nie pojedynczej linii:

Wykres słupkowy dla niezgrupowanego rozkładu częstotliwości

Obydwa wykresy pozwalają nam szybko zrozumieć rozkład wartości w naszym zbiorze danych.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *