グループ化されていない度数分布: 定義と例

によるベンジャミン・アンダーソン博士 7月 26, 2023 ガイド 0コメント

15 世帯に、家で動物を何匹飼っているかを尋ねる調査を実施するとします。結果は次のとおりです。

1、1、1、1、2、2、2、3、3、4、5、5、6、7、8

これらの結果を要約する 1 つの方法は、度数分布を作成することです。これにより、データセット内に異なる値がどのくらいの頻度で出現するかを知ることができます。

私たちは、値のグループを作成し、それらのグループに分類されるデータセット内の観測値の数を要約するクラスター化頻度分布をよく使用します。

以下は、調査データのグループ化された度数分布の例です。

まずサイズ 2 のグループを作成し、次に各グループに分類されるデータセットからの個々の観測値の数を数えました。例えば：

作成できる別のタイプの度数分布は、グループ化されていない度数分布です。これは、データ値のグループではなく、個々のデータ値の度数を表示します。

以下は、調査データの非クラスター化度数分布の例です。

グループ化されていない度数分布の例

このタイプの頻度分布を使用すると、データセット内で異なる値がどのくらいの頻度で発生したかを直接確認できます。例えば：

等々。

グループ化されていない度数分布は、データセット内に個々の値がどのくらいの頻度で現れるかを確認する場合に役立ちます。

非クラスター化度数分布は、一意の値が少数しかない小規模なデータセットで最も効果的に機能することに注意してください。

たとえば、以前の調査データには固有の値が 8 つしかなかったため、非クラスター化度数分布を作成することが理にかなっていました。

ただし、数百の値または一意の値を含む数千のデータセットがある場合、クラスター化されていない度数分布は信じられないほど時間がかかり、情報を収集するのが困難になります。

より大きなデータセットの場合は、グループ化された度数分布を構築することが合理的です。

グループ化されていない度数分布の値を視覚化する最も簡単な方法は、単純なグラフに個々の値の度数を表示する度数多角形を作成することです。

サンプルデータの周波数ポリゴンは次のようになります。

グループ化されていない周波数分布の周波数ポリゴン

これは、各値がデータセット内にどのくらいの頻度で出現するかを迅速に理解するのに役立ちます。

あるいは、棒グラフを作成して、単線ではなく棒を使用してまったく同じデータを表示することもできます。

グループ化されていない度数分布の棒グラフ

どちらのグラフでも、データセット内の値の分布をすぐに理解できます。

私はベンジャミンです。退職した統計教授から、専任の Statorials 教育者になりました。統計分野における豊富な経験と専門知識を活かして、私は Statorials を通じて学生に力を与えるために自分の知識を共有することに尽力しています。もっと知る