Spss で箱ひげ図を作成および解釈する方法
箱ひげ図は、以下を含むデータセットの 5 桁の概要を視覚化するために使用されます。
- 最小
- 最初の四分位
- 中央値
- 第 3 四分位
- 最大
このチュートリアルでは、SPSS で箱ひげ図を作成および編集する方法を説明します。
SPSS で単一の箱ひげ図を作成する方法
特定のチームの 16 人のバスケットボール選手が 1 試合ごとに獲得した平均ポイントを示す次のデータセットがあるとします。
これらのデータ値の分布を視覚化する箱ひげ図を作成するには、 「分析」タブ、 「記述統計」 、 「探索」の順にクリックします。
これにより、次のウィンドウが表示されます。
箱ひげ図を作成するには、変数点を[依存リスト] というラベルの付いた領域にドラッグします。次に、ボックスの下部にある[表示]というオプションで[プロット]が選択されていることを確認します。
[OK]をクリックすると、次の箱ひげ図が表示されます。
この箱ひげ図を解釈する方法は次のとおりです。
外れ値に関するメモ
四分位範囲 (IQR) は、第 3 四分位と第 1 四分位の間の距離です。 SPSS は、データ値が第 3 四分位を超える IQR の 1.5 倍、または第 1 四分位を下回る IQR の 1.5 倍である場合に、外れ値とみなします。
SPSS では、外れ値は小さな円として表示されます。前の例では外れ値がなかったので、箱ひげ図に小さな円が表示されませんでした。ただし、データセット内の最大値が実際には 50 だった場合、箱ひげ図には外れ値を示す小さな円が表示されます。
データセットに外れ値が存在する場合、いくつかのオプションがあります。
- 外れ値がデータ入力エラーではないことを確認してください。場合によっては、データ値が単に間違って記録されることがあります。外れ値が存在する場合は、まず値が正しく入力されていること、およびそれがエラーではないことを確認してください。
- 外れ値に新しい値を割り当てます。外れ値がデータ入力エラーの結果であることが判明した場合は、データ セットの平均や中央値などの新しい値を割り当てることができます。
- 外れ値を削除します。値が本当に外れ値であり、分析全体に重大な影響を与える場合は、その値を削除することを選択できます。最終レポートまたは分析では、外れ値を削除したことを必ず明記してください。
SPSS で複数の箱ひげ図を作成する方法
複数の変数がある場合、SPSS は複数の箱ひげ図を並べて作成することもできます。たとえば、3 つの異なるチームの 16 人のプレーヤーが獲得した平均ポイントに関する次のデータがあるとします。
これらの各変数の箱ひげ図を作成するには、再度[分析]タブをクリックし、 [記述統計] 、 [探索]の順にクリックします。次に、3 つの変数を[Dependent List]というラベルの付いた領域にドラッグします。
[OK]をクリックすると、次の箱ひげ図が表示されます。
これは、これら 3 つのチーム間の分布の違いを簡単に視覚化するのに役立ちます。
また、次のことも観察できます。
- 1 試合あたりの平均得点はチーム B が最も高く、チーム C が最も低くなります。
- チーム A やチーム C と比較した箱ひげ図の長さからわかるように、ゲームごとの得点の変動はチーム B で最も大きくなります。
- 1 試合あたりの得点が最も多いプレーヤーがチーム B に所属し、1 試合あたりの得点が最も少ないプレーヤーがチーム C に所属します。
箱ひげ図は、単一のグラフからデータセットの分布に関する多くの情報を得ることができるため便利です。