マルチモーダル配信とは何ですか?
マルチモーダル分布は、 2 つ以上のモードを持つ確率分布です。
ヒストグラムを作成して多峰性分布を視覚化すると、いくつかのピークがあることがわかります。
分布にちょうど 2 つのピークがある場合、それは二峰性分布(多峰性分布の特定のタイプ) とみなされます。
これは、ピークが 1 つだけある単峰分布とは対照的です。
正規分布のような単峰分布は統計学のトピックを説明するために最もよく使用されますが、実際には多峰分布が実際に頻繁に現れるため、それらを認識して分析する方法を知っておくと役立ちます。
マルチモーダル配信の例
マルチモーダル配信の例をいくつか示します。
例 1: 試験結果の配布
教授がクラスに試験を行うとします。勉強した学生もいれば、勉強しなかった学生もいました。教授が試験の得点のヒストグラムを作成すると、勉強しなかった生徒の低い得点付近にピークがあり、勉強した生徒の高い得点付近に別のピークがある多峰性分布に従います。
例 2: さまざまな植物種の高さ
科学者が野原を歩き回り、さまざまな植物の高さを測定するとします。彼女は気づかずに 3 つの異なる種のサイズを測定しました。1 つは非常に大きく、もう 1 つは中くらいの大きさ、もう 1 つは非常に小さいです。
彼女が身長分布を視覚化するためにヒストグラムを作成すると、それが多峰性であることがわかりました。各ピークは 3 つの異なる種の最も一般的な身長を表しています。
例 3: 顧客の分布
レストランのオーナーは、時間ごとに来店する顧客の数を追跡します。顧客の分布を視覚化するためにヒストグラムを作成すると、分布が多峰性であることがわかります。昼食時間にピークがあり、夕食時間にも別のピークがあります。
多峰性分布の原因は何ですか?
通常、マルチモーダル分布の根底には次の 2 つの原因のいずれかが存在します。
1. いくつかのグループがグループ化されます。
気づかずに複数のグループのデータを収集すると、マルチモーダル分布が発生する可能性があります。
たとえば、科学者が同じ畑にある 3 つの異なる植物種の高さを無意識に測定した場合、すべての植物の分布が同じヒストグラム上に配置されると多峰的に見えます。
2. 根本的な現象がある。
多峰性分布は、特定の基礎的な現象によって発生することもあります。
たとえば、人々は昼食と夕食の 2 つの異なる時間にレストランで食事をする傾向があるため、レストランを訪れる 1 時間ごとの顧客の数は、多峰性分布に従います。この根底にある人間の行動が多峰性分布の起源です。
多峰性分布を分析する方法
私たちは平均値または中央値を使用して分布を記述することがよくあります。これにより、分布の「中心」がどこにあるのかがわかるからです。
残念ながら、二峰性分布の場合、平均と中央値を知ることは役に立ちません。たとえば、上の例の生徒の試験の平均点は 81 です。
ただし、81 点近くのスコアを獲得した生徒はほとんどいませんでした。この場合、平均値は誤解を招きます。実際、ほとんどの生徒のスコアは 74 か 88 程度でした。
二峰性分布を分析および解釈するより良い方法は、単純にデータを 2 つの異なるグループに分割し、各グループの中心の位置と分布を個別に分析することです。
たとえば、試験結果を「低いスコア」と「高いスコア」に分けて、各グループの平均と標準偏差を求めることができます。
平均、中央値、標準偏差などの特定の分布の要約統計量を計算するときは、必ず分布を視覚化して単峰性か多峰性かを判断してください。
分布が多峰性である場合、単一の平均、中央値、または標準偏差を使用してそれを説明すると誤解を招く可能性があります。