グループ化されたデータ
この記事では、グループ化されたデータとは何か、およびデータがどのようにグループ化されるかについて説明します。さらに、データを間隔ごとにグループ化する解決済みの演習もあります。
グループ化されたデータとは何ですか?
統計において、ビン化されたデータは、間隔ごとにグループ化されたデータです。言い換えれば、グループ化されたデータは、一緒に調査できるように一定の間隔で収集されたデータです。
したがって、統計データのセットをグループ化する場合、統計データは異なる間隔に分割され、各データは 1 つの間隔にのみ属することができます。
つまり、統計学では、データ クラスタリングにより複数のデータをまとめて分析できるため、ある間隔内でグループ化されたデータが 1 つのデータとして扱われます。さらに、サンプルが非常に大きい場合、データ プーリングは非常に役立ちます。
グループ化されたデータの例
グループ化されたデータの定義を見て、データのセットが異なる間隔にどのようにグループ化されるかを示す具体的な例を以下に示します。
- 50 人の異なる人々のサンプル サイズが測定され、すべての値が次のデータ表に記録されました。データセットを間隔ごとにグループ化し、データをグラフ化します。
まず、データを間隔に分割する必要があります。これには多くの方法がありますが、理想的な間隔数を計算できるため、スタージェス規則が最もよく使用されます。
したがって、データを 7 つの異なる間隔に分割する必要があります。次に、各間隔の幅を知る必要があります。これを行うには、最大値から最小値を引いた値を間隔の合計数で割るだけです。
つまり、振幅 9 の間隔が 7 つ存在する必要があるため、スタージェスの法則に従って計算された間隔は次のようになります。
間隔を計算したら、各間隔でデータが出現する回数を数え、グループ化されたデータを含むテーブルを作成します。
グループ化されたデータからさらに多くの頻度タイプ (相対頻度、累積頻度など) を計算できることに留意してください。グループ化されたデータを含む完全な度数表を作成する方法を確認するには、ここをクリックしてください。
最後に、各間隔の頻度を示すテーブルから、グループ化されたデータをヒストグラムにグラフ化できます。
グループ化されたデータとグループ化されていないデータ
グループ化されていないデータは、間隔に分割されていないデータですが、各値は個別に調査されます。
上記の例に従って、データをグループ化していなかったら、各値の頻度を見つける必要がありました。つまり、158、165、174 などの値を何倍にするかを計算する必要がありました。が繰り返される。ただし、この場合、大量のデータがあり、さらに多くの値が類似していたため、データを間隔ごとにグループ化する方が適切でした。
したがって、統計調査では、計算を実行する前に、データを間隔ごとにグループ化するかどうかを決定することが重要です。これにより、残りの調査の条件が決まります。
データはいつ統合する必要がありますか?
一般に、変数が連続である場合、データは間隔にグループ化する必要があります。変数が連続の場合、通常は多くの値があり、それらは互いに非常に近いため、それらを間隔にグループ化して研究を簡素化できます。
論理的には、変数が連続的でなくても、大量のデータがある場合は区間にグループ化することもできるため、統計分析が容易になります。ただし、一般に、データをグループ化する基準は変数のタイプです。変数が連続している場合、データは通常、間隔に分割されます。