実生活における誤った相関関係の 5 つの例
統計学において、擬似相関とは、一方の変数が実際に他方の変数を引き起こすことなく、純粋に偶然に発生する 2 つの変数間の相関関係を指します。
このタイプの相関関係は、実際には相関関係がまったく偶然に存在するにもかかわらず、ある変数が別の変数を引き起こすことを示唆する場合があるため、危険です。
この種の変数間の相関関係は、実生活では常に発生していることがわかります。
次の例では、偽相関の 5 つの異なる実際の例を共有します。
例 1: マスター作品と興行収入
毎年大学が授与する修士号の総数と年間に生み出される興行収入の合計に関するデータを収集すると、2 つの変数が高度に相関していることがわかります。
これは、より多くの修士号を発行することで毎年の興行収入が増加するという意味ではありません。
最も可能性の高い説明は、世界の人口が年々増加しているということです。これは、毎年より多くの修士号が授与され、毎年映画を観に行く人の数もほぼ同じ割合で増加していることを意味します。
2 つの変数間の相関関係は偽です。
例 2: 結婚率と関連した麻疹症例
米国の麻疹症例総数と結婚率に関するデータを毎年収集すると、2 つの変数に高い相関があることがわかります。
これは、麻疹症例の減少が何らかの形で結婚率の低下につながることを意味するものではありません。 2 つの変数は独立しています。
現代医学のおかげで麻疹の症例は減少しており、さまざまな理由で結婚する人は毎年減少しています。
2 つの変数間の相関関係は偽です。
例 3: ドーナツ消費量に対する高校卒業生の割合
米国の高校卒業者の総数とドーナツの総消費量に関するデータを毎年収集すると、2 つの変数に高い相関があることがわかります。
これは、高校卒業者数の増加が米国でのドーナツ消費量の増加につながることを意味するものではありません。
最も可能性の高い説明は、米国の人口が時間の経過とともに増加しているということです。これは、人口の増加に伴い高校卒業資格を持つ人の数と消費されるドーナツの総数が増加することを意味します。
これは誤った相関関係です。
例 4: ビデオゲームの売上と原子力発電の生産量
世界中で毎年行われるビデオ ゲームの総売上高と原子力発電所によって生成される総エネルギーに関するデータを収集すると、2 つの変数が高度に相関していることがわかります。
これは、ビデオゲームの売上の増加が原子力発電の増加につながるという意味ではありません。
その代わりに、世界の人口が年々増加するにつれて、より多くの原子力発電所が建設され、より多くのビデオゲームが販売されています。
両方の変数が時間の経過とともに継続的に増加しても、一方が他方の原因ではありません。両者の相関関係は疑わしい。
例 5: ゲームセンターの収入と炭鉱の仕事
米国のゲームセンターが生み出す総収益と米国の石炭採掘の総雇用数に関するデータを収集すると、2 つの変数が高度に相関していることがわかります。
これは、一方の変数が他方の変数を減少させるという意味ではありません。
むしろ、ゲームセンターや炭鉱は長年にわたってあまり一般的ではなくなっており、これが両方の変数がほぼ同じ割合で減少した理由を説明しています。
2 つの変数間の相関関係は偽です。
追加リソース
次のチュートリアルでは、他の統計概念の実世界の例を示します。