グループ化されたデータの中央値を見つける方法: 例付き
何らかの方法でグループ化されたデータの中央値を計算したいことがよくあります。
すべての値を最小値から最大値の順に並べた場合、中央値はデータ セットの中央にある値を表すことを思い出してください。
たとえば、次のようなグループ化されたデータがあるとします。
生データの値がわからないため、正確な中央値を計算することはできませんが、次の式を使用して中央値を推定することは可能です。
グループ化されたデータの中央値 = L + W[(N/2 – C) / F]
金:
- L : 中央値クラスの下限値
- W : クラス幅の中央値
- N : 合計頻度
- C : 中央クラスまでの累積度数
- F : クラス頻度の中央値
注:中間クラスは、 N/2 に位置する値を含むクラスです。上の例では、合計値は N = 23 個あります。したがって、中央値は位置 23/2 = 11.5 となり、21 ~ 30 クラスになります。
次の例は、さまざまなシナリオでグループ化されたデータの中央値を計算する方法を示しています。
例 1: グループ化されたデータの中央値を計算する
特定のクラスの 40 人の生徒によって採点された試験を示す次の度数分布があるとします。
この例では、合計値は N = 40 個あります。したがって、中央値は 40/2 = 20 が位置するクラスにあります。 20 番目に大きい値は、クラス71-80にあります。
これを知ると、次の値を計算できます。
- L : 中流階級下限: 71
- W : クラス幅の中央値: 9
- N : 合計回数: 40
- C : クラス中央値までの累積頻度: 12
- F : クラス頻度の中央値: 15
これらの値を式に代入して、分布の中央値を計算できます。
- 中央値 = L + W[(N/2 – C) / F]
- 中央値 = 71 + 9[(40/2 – 12) / 15]
- 中央値 = 75.8
試験スコアの中央値は75.8であると推定されます。
例 2: グループ化されたデータの中央値を計算する
60 人のバスケットボール選手が 1 試合ごとに獲得した得点数を示す次の度数分布があるとします。
この例では、合計値は N = 60 個あります。したがって、中央値は 60/2 = 30 が位置するクラスにあります。 30 番目に大きい値は、クラス11-20にあります。
これを知ると、次の値を計算できます。
- L : 中級下限: 11
- W : クラス幅の中央値: 9
- N : 合計回数: 60
- C : 中央クラスまでの累積度数: 8
- F : クラス頻度の中央値: 25
これらの値を式に代入して、分布の中央値を計算できます。
- 中央値 = L + W[(N/2 – C) / F]
- 中央値 = 11 + 9[(60/2 – 8) / 25]
- 中央値 = 18.92
試験スコアの中央値は18.92であると推定されます。
追加リソース
次のチュートリアルでは、グループ化されたデータを使用して他の一般的な操作を実行する方法について説明します。
グループ化されたデータの平均と標準偏差を見つける方法
グループ化されたデータモードを見つける方法
グループ化されたデータのパーセンタイル ランキングを計算する方法