隠し変数: 定義と例
隠れ変数は、統計分析には含まれないが、分析内の 2 つの変数間の関係に影響を与える変数です。
隠し変数は、変数間の本当の関係を隠したり、変数間に関係が存在するかのような誤った印象を与えたりする可能性があります。基本的に、隠れた変数によって研究結果が誤解を招く可能性があります。
観察研究では、隠れた変数がデータの異常な解釈や変数間の関係につながる可能性があることに注意することが重要です。実験研究では、隠れた変数のリスクを (可能な限り) 排除する方法で実験を設計することが重要です。
隠し変数の例
次の例は、研究に隠れた変数が存在する可能性があるいくつかのケースを示しています。
例1
研究者は、アイスクリームの売上とサメの攻撃には強い正の相関があることを発見しました。これは、アイスクリームの売上の増加がサメの襲撃を引き起こしていることを意味するのでしょうか?
それはありそうにありません。最も考えられる原因は、潜在的な天候の変化です。外が暖かくなると、アイスクリームを買う人も海に行く人も増えます。
例 2
研究者は、ポップコーンの消費量と長年にわたる交通事故の件数に強い相関があることを発見しました。これは、ポップコーンの消費量が増えると交通事故が増えることを意味するのでしょうか?
それはありそうにありません。最も可能性の高い原因は、潜在的な集団の変動です。人口が増加するとポップコーンの消費量も増加し、交通事故も増加します。
例 3
ある研究によると、自然災害後に名乗り出たボランティアが多ければ多いほど、被害は大きくなるという。これは、ボランティアがより多くの被害を引き起こしていることを意味しますか?
それはありそうにありません。最も考えられる原因は、自然災害の規模の違いです。自然災害が大規模化すると、ボランティアの参加者数も増加し、自然災害による被害額も増加します。
例 4
研究によると、グローブの販売とスノーボードの事故には強い相関があることがわかりました。ということは、手袋をするとスノーボード事故が増えるということなのでしょうか?
それはありそうにありません。最も考えられる原因は、潜在的な温度変化です。気温が下がるにつれ、手袋を買う人も増え、スノーボードをする人も増えています。
隠れた変数を特定する方法
隠れた変数を明らかにするには、研究対象分野の専門知識が役立ちます。研究に明示的に含まれていない研究変数間の関係にどのような潜在的な変数が影響を与える可能性があるかを知ることで、潜在的な隠れた変数を明らかにできる可能性があります。
潜在的な隠れ変数を特定するもう 1 つの方法は、残差プロットを調べることです。残差に傾向 (線形または非線形) がある場合、これは、研究に含まれていない隠れた変数が何らかの形で研究変数に影響を与えていることを意味する可能性があります。
隠れた変数のリスクを排除する方法
観察研究では、隠れた変数のリスクを排除することが非常に難しい場合があります。ほとんどの場合、できる最善のことは、研究に影響を与える可能性のある潜在的な隠れた変数を防ぐのではなく、単に特定することです。
ただし、実験研究では、優れた実験計画によって隠れた変数の影響を大幅に排除できます。
たとえば、2 つの錠剤が血圧に異なる影響を与えるかどうかを知りたいとします。食事や喫煙習慣などの隠れた変数も血圧に影響を与えることがわかっています。したがって、 ランダム化された設計を使用して、これらの隠れた変数の制御を試みることができます。これは、患者をランダムに 1 錠目または 2 錠目の錠剤のいずれかに割り当てることを意味します。
患者をランダムにグループに割り当てているため、隠れた変数は両方のグループにほぼ同じ影響を与えると想定できます。これは、血圧のあらゆる違いは、隠れた変数の影響ではなく、錠剤に起因する可能性があることを意味します。