四分位範囲を解釈する方法: 例付き
データ セットの四分位範囲(IQR と略されることも多い) は、データ セットの第 1 四分位 (25 パーセンタイル) と第 3 四分位 (75 パーセンタイル) の差です。
簡単に言うと、値の中央の 50% の間の偏差を測定します。
IQR = 第 3 四半期 – 第 1 四半期
たとえば、実験室内の 17 種類の植物の高さ (インチ単位) を示す次のデータセットがあるとします。
データセット: 1、4、8、11、13、17、19、19、20、23、24、24、25、28、29、31、32
四分位範囲計算ツールによると、このデータセットの四分位範囲 (IQR) は次のように計算されます。
- T1: 12
- T3: 26.5
- IQR = 第 3 四半期 – 第 1 四半期 = 14.5
これは、データセット内の値の中央の 50% の広がりが14.5インチであることを示しています。
四分位範囲が役立つ理由
四分位範囲はデータセット内の値の分布を測定する方法の 1 つですが、分布には次のような他の尺度もあります。
- 範囲:データセット内の最小値と最大値の差を測定します。
- 標準偏差:データセット内の平均値からの個々の値の典型的な偏差を測定します。
四分位範囲 (IQR) を使用してデータセット内の値の分布を測定する利点は、極端な外れ値の影響を受けないことです。
たとえば、IQR ではデータセットの 25 パーセンタイル値と 75 パーセンタイル値のみが使用されるため、データセット内の極端に小さい値または極端に大きい値は IQR 計算に影響しません。
これを説明するために、次のデータセットを考えてみましょう。
データセット: 1、4、8、11、13、17、19、19、20、23、24、24、25、28、29、31、32
このデータセットには次の伝播測定値があります。
- IQR: 14.5
- 標準偏差: 9.25
- 範囲: 31
ただし、データセットに極端な外れ値が含まれているかどうかを考慮してください。
データセット: 1、4、8、11、13、17、19、19、20、23、24、24、25、28、29、31、32、378
計算機を使用すると、このデータセットの次の広がりの測定値を見つけることができます。
- IQR: 15
- 標準偏差: 85.02
- 範囲: 377
外れ値が存在する場合、四分位範囲はほとんど変化しませんが、標準偏差と範囲は両方とも大幅に変化することに注意してください。
データセット間の四分位範囲の比較
四分位範囲は、異なるデータセット間の値の分布を比較するために使用することもできます。
たとえば、次の IQR 値を持つ 3 つのデータセットがあるとします。
- データセット 1 の IQR: 13.5
- データセット 2 の IQR: 24.4
- データセット 3 IQR: 8.7
これは、値の中間 50% 間のギャップがデータセット 2 で最大で、データセット 3 で最小であることを示しています。
追加リソース
Excel で四分位範囲を計算する方法
Python で四分位範囲を計算する方法
四分位範囲を使用して外れ値を見つける方法
四分位範囲計算ツール