右に歪んだヒストグラム: 例と解釈
ヒストグラムは、一連のデータ内の値の分布を視覚化できるグラフの一種です。
分布の右側に「裾」がある場合、ヒストグラムは右に歪んでいると言えます。
注: 右に歪んだヒストグラムは、正に歪んだヒストグラムと呼ばれることもあります。
右に歪んだヒストグラムには、次の 2 つの特性があります。
1. 分布の頂点は左側にあります。
2. 平均値が中央値より大きい。
ヒストグラムが正しく歪むのはなぜでしょうか?
一般に、可能な最小値には制限があるが、可能な最大値には制限がない場合、ヒストグラムは右に傾きます。
右に歪んだヒストグラムの最も明らかな実際の例は、ある国の所得分布です。
人が獲得できる最低収入はゼロドルですが、人が獲得できる最大収入はありません。
一般に、ほとんどの人は年間約 40,000 ドルを稼ぐことができますが、年間数百万ドルを稼ぐ少数の例外もいます。
所得分布を視覚化するためにヒストグラムを作成すると、当然のことながら歪みが生じます。
右に歪んだヒストグラムで平均値が中央値より大きいのはなぜですか?
右に歪んだヒストグラムでは、分布の右側の「裾」の値が高いと平均値が大きく膨らむため、平均値は中央値よりも大きくなります。
簡単な例として、10 人の収入を含む次のデータセットがあるとします。
データセット 1: $30,000、$35,000、$35,000、$40,000、$50,000、$55,000、$55,000、$70,000、$90,000、$110,000
このデータセットの平均値と中央値は次のとおりです。
- 平均: 57,000ドル
- 中央値: 525,000ドル
ここで、最後の値が 250 万ドルであることを除いて、まったく同じ収入を含む別のデータ セットがあるとします。
データセット 2: 30,000 ドル、35,000 ドル、35,000 ドル、40,000 ドル、50,000 ドル、55,000 ドル、55,000 ドル、70,000 ドル、90,000 ドル、250 万ドル
このデータセットの平均値と中央値は次のとおりです。
- 平均: 296,000ドル
- 中央値: 525,000ドル
この後者の外れ値は、平均収入の大幅な増加につながります。
この分布をプロットすると、250 万ドルの値がヒストグラムの右側の「尾部」に位置する右に歪んだヒストグラムになります。
右と左の歪んだヒストグラムの違い
右に歪んだヒストグラムの反対は、左に歪んだヒストグラムです。
これは、分布の左側に「裾」があるタイプのヒストグラムです。
このタイプのヒストグラムには次の特性があります。
1. 分布のピークは右側にあります。
2. 平均値が中央値よりも低い。
これらは、右に歪んだヒストグラムの正反対の特性であることに注意してください。
左に歪んだヒストグラムについて詳しくは、 このチュートリアルをご覧ください。
追加リソース
次のチュートリアルでは、ヒストグラムに関する追加情報を提供します。