グループ化されたデータ

この記事では、グループ化されたデータとは何か、およびデータがどのようにグループ化されるかについて説明します。さらに、データを間隔ごとにグループ化する解決済みの演習もあります。

グループ化されたデータとは何ですか?

統計において、ビン化されたデータは、間隔ごとにグループ化されたデータです。言い換えれば、グループ化されたデータは、一緒に調査できるように一定の間隔で収集されたデータです。

したがって、統計データのセットをグループ化する場合、統計データは異なる間隔に分割され、各データは 1 つの間隔にのみ属することができます。

つまり、統計学では、データ クラスタリングにより複数のデータをまとめて分析できるため、ある間隔内でグループ化されたデータが 1 つのデータとして扱われます。さらに、サンプルが非常に大きい場合、データ プーリングは非常に役立ちます。

グループ化されたデータの例

グループ化されたデータの定義を見て、データのセットが異なる間隔にどのようにグループ化されるかを示す具体的な例を以下に示します。

  • 50 人の異なる人々のサンプル サイズが測定され、すべての値が次のデータ表に記録されました。データセットを間隔ごとにグループ化し、データをグラフ化します。

まず、データを間隔に分割する必要があります。これには多くの方法がありますが、理想的な間隔数を計算できるため、スタージェス規則が最もよく使用されます。

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(50)\\[2ex]c=1+5,64\\[2ex]c=6,64\\[2ex]c\approx 7\end{array}

したがって、データを 7 つの異なる間隔に分割する必要があります。次に、各間隔の幅を知る必要があります。これを行うには、最大値から最小値を引いた値を間隔の合計数で割るだけです。

a=\cfrac{\text{valor m\'aximo}-\text{valor m\'inimo}}{c}=\cfrac{205-145}{7}=8,57\approx 9

つまり、振幅 9 の間隔が 7 つ存在する必要があるため、スタージェスの法則に従って計算された間隔は次のようになります。

[145,154)

[154,163)

[163,172)

[172,181)

[181,190)

[190,199)

[199,208)

間隔を計算したら、各間隔でデータが出現する回数を数え、グループ化されたデータを含むテーブルを作成します。

グループ化されたデータからさらに多くの頻度タイプ (相対頻度、累積頻度など) を計算できることに留意してください。グループ化されたデータを含む完全な度数表を作成する方法を確認するには、ここをクリックしてください。

最後に、各間隔の頻度を示すテーブルから、グループ化されたデータをヒストグラムにグラフ化できます。

スタージェス則ヒストグラム、統計

グループ化されたデータとグループ化されていないデータ

グループ化されていないデータは、間隔に分割されていないデータですが、各値は個別に調査されます。

上記の例に従って、データをグループ化していなかったら、各値の頻度を見つける必要がありました。つまり、158、165、174 などの値を何倍にするかを計算する必要がありました。が繰り返される。ただし、この場合、大量のデータがあり、さらに多くの値が類似していたため、データを間隔ごとにグループ化する方が適切でした。

したがって、統計調査では、計算を実行する前に、データを間隔ごとにグループ化するかどうかを決定することが重要です。これにより、残りの調査の条件が決まります。

データはいつ統合する必要がありますか?

一般に、変数が連続である場合、データは間隔にグループ化する必要があります。変数が連続の場合、通常は多くの値があり、それらは互いに非常に近いため、それらを間隔にグループ化して研究を簡素化できます。

論理的には、変数が連続的でなくても、大量のデータがある場合は区間にグループ化することもできるため、統計分析が容易になります。ただし、一般に、データをグループ化する基準は変数のタイプです。変数が連続している場合、データは通常、間隔に分割されます。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です