Niezgrupowany rozkład częstotliwości: definicja i przykład
Załóżmy, że przeprowadzamy ankietę, w której pytamy 15 gospodarstw domowych, ile zwierząt mają w domu. Wyniki są następujące:
1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 5, 5, 6, 7, 8
Jednym ze sposobów podsumowania tych wyników jest utworzenie rozkładu częstotliwości , który mówi nam, jak często różne wartości pojawiają się w zbiorze danych.
Często korzystamy z klastrowych rozkładów częstotliwości , w których tworzymy grupy wartości, a następnie podsumowujemy liczbę obserwacji w zbiorze danych, które należą do tych grup.
Oto przykład pogrupowanego rozkładu częstotliwości dla danych z naszej ankiety:
Najpierw utworzyliśmy grupy o rozmiarze 2, a następnie policzyliśmy liczbę pojedynczych obserwacji ze zbioru danych należących do każdej grupy. Na przykład:
- W 7 rodzinach było 1 lub 2 zwierzęta
- 3 rodziny miały 3 lub 4 zwierzęta
- 3 rodziny miały 5 lub 6 zwierząt
- W 2 rodzinach było 7 lub 8 zwierząt
Innym rodzajem rozkładu częstotliwości, jaki moglibyśmy stworzyć, jest rozkład częstotliwości niezgrupowany , w którym wyświetlana jest częstotliwość każdej pojedynczej wartości danych, a nie grup wartości danych.
Oto przykład nieklastrowanego rozkładu częstotliwości dla naszych danych ankietowych:
Ten rodzaj rozkładu częstotliwości pozwala nam bezpośrednio zobaczyć, jak często w naszym zbiorze danych występowały różne wartości. Na przykład:
- 4 rodziny miały 1 zwierzę
- 3 rodziny miały 2 zwierzęta
- 2 rodziny miały 3 zwierzęta
- 1 rodzina miała 4 zwierzęta
I tak dalej.
Kiedy stosować niezgrupowane rozkłady częstotliwości
Niezgrupowane rozkłady częstotliwości mogą być przydatne, gdy chcesz zobaczyć, jak często każda pojedyncza wartość pojawia się w zbiorze danych.
Należy pamiętać, że nieklastrowane rozkłady częstotliwości najlepiej sprawdzają się w przypadku małych zbiorów danych, w których występuje tylko kilka unikalnych wartości.
Na przykład w naszych poprzednich danych z ankiety było tylko 8 unikalnych wartości, więc sensowne było utworzenie nieklastrowanego rozkładu częstotliwości.
Gdybyśmy jednak mieli tysiące zestawów danych zawierających setki lub unikalne wartości, nieklastrowany rozkład częstotliwości byłby niezwykle czasochłonny i trudny do zebrania informacji.
W przypadku większych zbiorów danych sensowne jest skonstruowanie pogrupowanych rozkładów częstotliwości.
Jak wizualizować niezgrupowane rozkłady częstotliwości
Najprostszym sposobem wizualizacji wartości w niezgrupowanym rozkładzie częstotliwości jest utworzenie wielokąta częstotliwości , który wyświetla częstotliwości każdej pojedynczej wartości na prostym wykresie.
Oto jak wyglądałby wielokąt częstotliwości dla naszych przykładowych danych:
Pomaga nam to szybko zrozumieć, jak często każda wartość pojawia się w zbiorze danych.
Alternatywnie możemy utworzyć wykres słupkowy , aby wyświetlić dokładnie te same dane za pomocą słupków, a nie pojedynczej linii:
Obydwa wykresy pozwalają nam szybko zrozumieć rozkład wartości w naszym zbiorze danych.