カイ二乗独立性検定: 定義、公式、例
独立性のカイ二乗検定は、 2 つのカテゴリ変数間に有意な関連があるかどうかを判断するために使用されます。
このチュートリアルでは次について説明します。
- 独立性のカイ二乗検定を実行する動機。
- 独立性のカイ二乗検定を実行するための公式。
- 独立性のカイ二乗検定を実行する方法の例。
カイ二乗独立性テスト: モチベーション
独立性のカイ二乗検定を使用すると、さまざまなコンテキストで 2 つのカテゴリ変数間に関連性があるかどうかを判断できます。ここではいくつかの例を示します。
- 私たちは、性別が政党の好みと関連しているかどうかを知りたいと考えています。そこで私たちは 500 人の有権者を対象に調査を行い、性別と政党の好みを記録しました。
- 私たちは、人の好きな色が好きなスポーツと関連しているかどうかを知りたいと考えています。そこで、100 人にアンケートを実施し、両方の好みを尋ねました。
- 教育レベルと婚姻状況が関連しているかどうかを知りたいと考えています。したがって、50 人の単純な無作為サンプルからこれら 2 つの変数に関するデータを収集します。
これらの各シナリオでは、2 つのカテゴリ変数が相互に関連しているかどうかを知りたいと考えています。各シナリオで、独立性のカイ二乗検定を使用して、変数間に統計的に有意な関連があるかどうかを判断できます。
カイ二乗独立性検定: 公式
独立性のカイ二乗検定では、次の帰無仮説と対立仮説を使用します。
- H 0 : (帰無仮説) 2 つの変数は独立しています。
- H 1 : (対立仮説) 2 つの変数は独立していません。 (つまり、それらは関連付けられています)
次の式を使用してカイ二乗 x 2検定統計量を計算します。
X 2 = Σ(OE) 2 / E
金:
- Σ: 「和」を意味する派手な記号
- ○:実測値
- E:期待値
(#rows-1)*(#columns-1) 自由度の検定統計量 X 2に対応する p 値が、選択した有意水準より小さい場合は、帰無仮説を棄却できます。
カイ二乗独立性検定: 例
性別が政党の好みと関連しているかどうかを知りたいとします。私たちは 500 人の有権者から単純に無作為にサンプルを採取し、彼らの政党の好みについて尋ねます。次の表は、調査の結果を示しています。
共和党 | 民主党 | 独立した | 合計 | |
男 | 120 | 90 | 40 | 250 |
女性 | 110 | 95 | 45 | 250 |
合計 | 230 | 185 | 85 | 500 |
次の手順を使用して独立性のカイ二乗検定を実行し、性別が政党の好みに関連しているかどうかを判断します。
ステップ 1: 前提条件を定義します。
次の仮定を使用して、独立性のカイ二乗検定を実行します。
- H 0 :性別と政党の好みは独立しています。
- H 1 :性別と政党の好みは独立していません。
ステップ 2: 期待値を計算します。
次に、次の式を使用して分割表の各セルの期待値を計算します。
期待値 = (行の合計 * 列の合計) / テーブルの合計。
たとえば、共和党員男性の期待値は (230*250) / 500 = 115です。
この式を繰り返すと、テーブルの各セルの期待値を取得できます。
共和党 | 民主党 | 独立した | 合計 | |
男 | 115 | 92.5 | 42.5 | 250 |
女性 | 115 | 92.5 | 42.5 | 250 |
合計 | 230 | 185 | 85 | 500 |
ステップ 3: テーブル内の各セルについて (OE) 2 /E を計算します。
次に、テーブル内の各セルに対して(OE) 2 /Eを計算します。ここで、
- ○:実測値
- E:期待値
たとえば、男性の共和党員の値は (120-115) 2 /115 = 0.2174になります。
テーブル内のセルごとにこの式を繰り返すことができます。
共和党 | 民主党 | 独立した | |
男 | 0.2174 | 0.0676 | 0.1471 |
女性 | 0.2174 | 0.0676 | 0.1471 |
ステップ 4: 検定統計量X2と対応する p 値を計算します。
X 2 = σ (OE) 2 / E = 0.2174 + 0.2174 + 0.0676 + 0.0676 + 0.1471 + 0.1471 = 0.8642
P 値に対するカイ二乗スコア計算機によると、X 2 = 0.8642 および (2-1)*(3-1) = 2 自由度に関連付けられた p 値は0.649198です。
ステップ 5: 結論を導き出します。
この p 値は 0.05 未満ではないため、帰無仮説を棄却できません。これは、性別と政党の好みの間に関連性があると言える十分な証拠がないことを意味します。
注: カイ二乗独立検定計算機を使用するだけで、この検定全体を実行することもできます。
追加リソース
次のチュートリアルでは、さまざまな統計プログラムを使用して独立性のカイ二乗検定を実行する方法を説明します。
Stata で独立性のカイ二乗検定を実行する方法
Excel でカイ二乗独立性検定を実行する方法
SPSS でカイ二乗独立性検定を実行する方法
Python でカイ二乗独立性検定を実行する方法
R でカイ二乗独立性検定を実行する方法
TI-84 計算機でのカイ二乗独立性テスト
独立性計算機のカイ二乗検定