バークソンバイアス: 定義と例
バークソンバイアスは、 2 つの変数がサンプルのデータでは負の相関があるように見えても、実際には 母集団全体では正の相関がある場合に研究で発生するバイアスの一種です。
たとえば、トムが地元のレストランのハンバーガーとミルクセーキの品質の相関関係を研究したいとします。
外出して、7 つの異なるレストランに関する次のデータを収集します。
データを視覚化するために散布図を作成します。
これら 2 つの変数間の ピアソン相関係数は-0.75で、これは強い負の相関に相当します。
この発見はトムにとって直感に反するものでした。トムは、おいしいハンバーガーを作るレストランはおいしいミルクシェイクも作ると考えるでしょう。
しかし、トムはまずいハンバーガーとまずいミルクシェイクを作る町のレストランをすべて無視していたことが判明しました。
もし彼がこれらのレストランを訪れたなら、次のデータセットを収集したでしょう:
このデータセットの散布図は次のようになります。
2 つの変数間の ピアソン相関係数は0.46であることがわかり、これは中程度に強い正の相関を示しています。
トムは市内の一部のレストランのみを調査したことにより、ハンバーガーとミルクシェイクの品質の間に負の相関関係があると誤って結論付けました。
実際、これら 2 つの変数の間には (ご想像のとおり) 正の関係があることがわかります。これはバークソンの偏見の典型的な例です。
実際にバークソンバイアスが発生する他のシナリオについては、次の例を参照してください。
例 1: 大学入学
大学が十分に高い GPA および ACT スコアを持つ学生のみを入学させると仮定します。
これら 2 つの変数が正の相関関係にあることはよく知られていますが、特定の大学に進学することを決めた学生の間では、この 2 つの変数の間に負の相関関係があるように見えることがわかりました。
ただし、この負の相関関係は、GPA と ACT スコアの両方が高い学生はエリート大学に進学できるのに対し、GPA と ACT スコアの両方が低い学生はまったく入学できないためにのみ発生します。
ACT と GPA の相関関係は母集団では正ですが、サンプルでは負の相関が見られます。これはバークソン側の偏見の事例です。
例 2: デートの好み
多くの人は、魅力的で性格も良いパートナーとのみデートします。
現実の世界では、これら 2 つの変数の間に相関関係はないかもしれませんが、デートの候補者を絞り込む場合、魅力がなくても才能がある潜在的なパートナーを完全に無視する可能性があります。 「性格が良い。
したがって、潜在的なパートナーの間では、これら 2 つの変数の間に負の相関関係があるように見えるかもしれません。魅力的な人は性格が悪く、性格が良い人は魅力が低いように見えます。
母集団ではこれら 2 つの変数の間に相関関係はありませんが、潜在的なパートナーのサンプルでは負の相関関係があるようです。これは単にバークソンの偏見の事例です。
バークソンバイアスを防ぐ方法
研究研究においてバークソンバイアスを回避する最も明白な方法は、母集団から 単純な無作為サンプルを収集することです。言い換えれば、対象となる母集団の各メンバーがサンプルに含まれる可能性が等しいことを確認します。
たとえば、特定の国での病気の蔓延を研究している場合、病院で連絡が取りやすい人だけではなく、国中の個人のサンプルを収集する必要があります。
単純な無作為サンプルを使用することで、研究者はサンプルが母集団を代表する可能性を最大化できます。つまり、サンプルから母集団全体に対して自信を持って発見を一般化することができます。