密度曲線とは何ですか? (説明と例)
密度曲線は、一連のデータ内の値の分布を表すグラフ上の曲線です。これは次の 3 つの理由で役立ちます。
1.密度曲線は、分布に周波数値の 1 つ以上の「ピーク」があるかどうか、分布が左に偏っているかどうかなど、分布の「形状」についての良いアイデアを与えてくれます。またはそうです。右。 。
2.密度曲線を使用すると、分布の平均と中央値がどこに関係しているかを視覚的に確認できます。
3.密度曲線を使用すると、データセット内の観測値の何パーセントが異なる値の間にあるかを視覚的に確認できます。
最もよく知られている密度曲線は、正規分布を表す釣鐘型曲線です。
密度曲線をより深く理解するために、次の例を考えてみましょう。
例: 密度曲線の作成と解釈
特定の圃場における 20 種類の異なる植物の高さ (インチ単位) を示す次のデータセットがあるとします。
4、5、5、6、6、6、6、7、7、7、7、7、8、8、8、9、9、9、2、2
各値の相対頻度を表示する単純なヒストグラムを作成すると、次のようになります。
X 軸はデータ値を示し、Y 軸は相対頻度を示します (たとえば、値「7」はデータセット内の合計 20 個の値のうち 5 回出現するため、相対頻度は 25% または0.25 。
この分布の「形状」を捉える密度曲線を作成すると、次のようになります。
ほとんどの値がそこにあるため、曲線は分布の中心近くで最も高くなります。また、これらの値 (高さ 4 インチまたは 10 インチなど) をとる植物が少ないため、分布の端近くで最も低くなります。
密度曲線を解釈する方法
密度曲線にはあらゆる形状とサイズがあり、特定のデータセット内の値の分布を視覚的にすばやく理解できるようになります。これらは、以下を視覚化するのに特に役立ちます。
1. 非対称性
歪度は、分布の対称性を説明する方法です。密度曲線を使用すると、グラフが左、右に傾いているか、または傾いていないかをすぐに確認できます。
2. 平均値と中央値の位置
密度曲線の歪みに基づいて、特定の分布において平均値と中央値のどちらが大きいかをすぐに知ることができます。特に:
- 密度曲線が非対称のままである場合、平均は中央値よりも低くなります。
- 密度曲線が右に傾いている場合、平均は中央値よりも大きくなります。
- 密度曲線に非対称性がない場合、平均は中央値と等しくなります。
3. ピークの数
密度曲線を使用すると、特定の分布に「ピーク」がいくつあるかをすぐに確認することもできます。上記の各例では、分布にはピークが 1 つしかないため、これらの分布を単峰性と表現します。
ただし、一部の分布には 2 つのピークが存在する場合があり、これを二峰性分布と呼びます。また、まれに、2 つ以上のピークを持つ多峰性分布が存在することもあります。
特定のデータセットの密度曲線を作成するだけで、分布内にピークがいくつあるかをすぐに確認できます。
密度曲線の性質
密度曲線には次の特性があります。
- 曲線の下の面積は常に合計 100% になります。
- 曲線が x 軸を下回ることはありません。
さまざまな分布の密度曲線を作成または解釈するときは、これら 2 つの事実に留意してください。