Yate 連続性の修正: 定義と例

によるベンジャミン・アンダーソン博士 7月 26, 2023 ガイド 0コメント

独立性のカイ二乗検定は、 2 つのカテゴリ変数間に有意な関連があるかどうかを判断するために使用されます。

この検定では、次の帰無仮説と対立仮説を使用します。

次の式を使用して、この検定のカイ 2 乗 x ²検定統計量を計算します。

X ² = Σ(O _i -E _i ) ² / E _i

金：

このテストは、分割表内の頻度の離散確率が連続分布であるカイ二乗分布で近似できることを前提としています。

ただし、この仮定は少し間違っている傾向があり、結果として得られるテスト統計は上方に偏る傾向があります。

このバイアスを補正するには、Yate の連続性補正を適用します。これにより、次の補正が式^X2に適用されます。

X ² = Σ(|O _i -E _i | – 0.5) ² / E _i

通常、この補正は、分割表内の少なくとも 1 つのセルの予想頻度が 5 未満である場合にのみ使用されます。

性別が政党の好みと関連しているかどうかを知りたいとします。 40 人の有権者から単純に無作為にサンプルを抽出し、政党の好みについて尋ねます。次の表は、調査の結果を示しています。

Yate の連続性補正を使用して独立性のカイ 2 乗検定を実行する方法は次のとおりです。

観測値:

期待値:

注:各セルの期待値は、行の合計と列の合計を乗算し、総計で割ることによって計算されます。たとえば、共和党男性の予想数は (21*19)/40 = 9.975 です。

^カイ^二乗_検定_統計_量:

(|8-9.975| – 0.5) ² / 9.975 = 0.218
(|9-6.3| – 0.5) ² / 6.3 = 0.768
(|4-4.725| – 0.5) ² / 4.725 = 0.011
(|11-9.025| – 0.5) ² / 9.025 = 0.241
(|3-5.7| – 0.5) ² / 5.7 = 0.849
(|5-4.275| – 0.5) ² / 4.275 = 0.012

^それで、

P 値:カイ二乗から P 値への計算ツールによると、2 自由度のカイ二乗検定統計量に対応する p 値は0.3501です。

この p 値は 0.05 未満ではないため、帰無仮説を棄却できません。これは、性別と政党の好みの間に関連性があると言える十分な証拠がないことを意味します。

私はベンジャミンです。退職した統計教授から、専任の Statorials 教育者になりました。統計分野における豊富な経験と専門知識を活かして、私は Statorials を通じて学生に力を与えるために自分の知識を共有することに尽力しています。もっと知る