グループ化されていない度数分布: 定義と例
15 世帯に、家で動物を何匹飼っているかを尋ねる調査を実施するとします。結果は次のとおりです。
1、1、1、1、2、2、2、3、3、4、5、5、6、7、8
これらの結果を要約する 1 つの方法は、度数分布を作成することです。これにより、データ セット内に異なる値がどのくらいの頻度で出現するかを知ることができます。
私たちは、値のグループを作成し、それらのグループに分類されるデータセット内の観測値の数を要約するクラスター化頻度分布をよく使用します。
以下は、調査データのグループ化された度数分布の例です。
まずサイズ 2 のグループを作成し、次に各グループに分類されるデータセットからの個々の観測値の数を数えました。例えば:
- 7 家族が 1 ~ 2 匹の動物を飼っていた
- 3 家族が 3 ~ 4 匹の動物を飼っていた
- 3 家族が 5 ~ 6 匹の動物を飼っていました
- 2 つの家族には 7 ~ 8 匹の動物がいた
作成できる別のタイプの度数分布は、グループ化されていない度数分布です。これは、データ値のグループではなく、個々のデータ値の度数を表示します。
以下は、調査データの非クラスター化度数分布の例です。
このタイプの頻度分布を使用すると、データセット内で異なる値がどのくらいの頻度で発生したかを直接確認できます。例えば:
- 4家族で1匹飼っていた
- 3家族で2匹飼っていた
- 2家族に3匹の動物がいた
- ある家族には4匹の動物がいました
等々。
グループ化されていない度数分布を使用する場合
グループ化されていない度数分布は、データ セット内に個々の値がどのくらいの頻度で現れるかを確認する場合に役立ちます。
非クラスター化度数分布は、一意の値が少数しかない小規模なデータ セットで最も効果的に機能することに注意してください。
たとえば、以前の調査データには固有の値が 8 つしかなかったため、非クラスター化度数分布を作成することが理にかなっていました。
ただし、数百の値または一意の値を含む数千のデータ セットがある場合、クラスター化されていない度数分布は信じられないほど時間がかかり、情報を収集するのが困難になります。
より大きなデータセットの場合は、グループ化された度数分布を構築することが合理的です。
グループ化されていない度数分布を視覚化する方法
グループ化されていない度数分布の値を視覚化する最も簡単な方法は、単純なグラフに個々の値の度数を表示する度数多角形を作成することです。
サンプル データの周波数ポリゴンは次のようになります。
これは、各値がデータセット内にどのくらいの頻度で出現するかを迅速に理解するのに役立ちます。
あるいは、棒グラフを作成して、単線ではなく棒を使用してまったく同じデータを表示することもできます。
どちらのグラフでも、データセット内の値の分布をすぐに理解できます。