グループ化されていないデータ
この記事では、統計におけるグループ化されていないデータとは何か、グループ化されていないデータの演習問題、およびグループ化されたデータとグループ化されていないデータの違いについて学びます。
グループ化されていないデータとは何ですか?
統計において、プールされていないデータとは、グループ化されていないが個別に調査されたデータです。つまり、データがグループ化されていない場合、データセット内の各値は個別に分析されます。
グループ化されていないデータは間隔を形成しませんが、グループ化されたデータは間隔を形成します。
一般に、変数が連続的である場合、または分析する値が多数ある場合、データはグループ化されます。したがって、データが離散変数に続き、データ量がそれほど多くない場合、データを間隔にグループ化する必要はありません。
グループ化されていないデータの例
グループ化されていないデータの定義を確認したら、概念をよりよく理解するために、このタイプの統計データを使用した例を解決していきます。
- 30人クラスの統計で得られた点数は以下の通りです。各音符の絶対周波数はいくらですか?
この場合、整数のみが存在できるため、データを間隔にグループ化する必要はなく、離散変数になります。
したがって、各値が出現する回数を数えて、それを配列に書き込むだけです。
データは間隔にグループ化されていないため、各値を個別に調査できます。したがって、各メモを取った生徒の数を知ることができます。
度数表を完成させるには、累積絶対度数、相対度数、累積相対度数などを常に計算する必要があることに注意してください。それがどのように行われるかはここで見ることができます:
グループ化されていないデータとグループ化されたデータ
このセクションでは、グループ化されたデータとグループ化されていないデータの違いについて説明します。さらに、論理的に、これが残りの調査の条件となるため、データをグループ化するのが適切な場合とそうでない場合を確認します。
グループ化されたデータとグループ化されていないデータの違いは、グループ化されているかどうかです。データがグループ化されている場合は、一定の間隔で収集されていることを意味しますが、データがグループ化されていない場合は、それぞれの値が個別に調査されていることを意味します。
一般に、変数が連続の場合、データは間隔ごとにグループ化されますが、変数が離散の場合は、データをグループ化しない方がよいでしょう。ただし、大量のデータがある場合は、統計調査を容易にするためにデータを間隔にグループ化することもできます。
プールされていないデータの統計的測定
度数表が構築された後、データがグループ化されていない場合は、通常、複数の統計的尺度を計算します。
具体的には、データのサンプルを要約し、さらに他のデータセットと比較できるようにするため、通常、中心傾向の尺度、分散の尺度、および位置の尺度が決定されます。
これらすべての統計パラメータがどのように計算されるかを次のリンクで確認できます。