Python でカイ二乗独立性検定を実行する方法
独立性のカイ二乗検定 2 つのカテゴリ変数間に有意な関連があるかどうかを判断するために使用されます。
このチュートリアルでは、Python でカイ二乗独立検定を実行する方法を説明します。
例: Python でのカイ二乗独立性検定
性別が政党の好みと関連しているかどうかを知りたいとします。私たちは 500 人の有権者から単純に無作為にサンプルを採取し、彼らの政党の好みについて尋ねます。次の表は、調査の結果を示しています。
共和党 | 民主党 | 独立した | 合計 | |
男 | 120 | 90 | 40 | 250 |
女性 | 110 | 95 | 45 | 250 |
合計 | 230 | 185 | 85 | 500 |
次の手順を使用して、Python でカイ二乗独立性テストを実行し、性別が政党の好みに関連しているかどうかを判断します。
ステップ 1: データを作成します。
まず、データを保持するテーブルを作成します。
data = [[120, 90, 40], [110, 95, 45]]
ステップ 2: 独立性のカイ二乗検定を実行します。
次に、SciPy ライブラリのchi2_contingency 関数を使用してカイ二乗独立性検定を実行できます。この関数は次の構文を使用します。
chi2_contingency (観測値)
金:
- 観測値:観測値の分割表。
次のコードは、特定の例でこの関数を使用する方法を示しています。
import scipy.stats as stats #perform the Chi-Square Test of Independence stats.chi2_contingency(data) (0.864, 0.649, 2, array([[115. , 92.5, 42.5], [115. , 92.5, 42.5]]))
結果を解釈する方法は次のとおりです。
- カイ二乗検定統計量: 0.864
- p値: 0.649
- 自由度: 2 (#rows-1 * #columns-1 として計算)
- 表: 最後の表には、分割表の各セルの期待値が表示されます。
独立性のカイ二乗検定では次の帰無仮説と対立仮説が使用されることを思い出してください。
- H 0 : (帰無仮説) 2 つの変数は独立しています。
- H 1 : (対立仮説) 2 つの変数は独立していません。
検定の p 値 (0.649) は 0.05 未満ではないため、帰無仮説を棄却できません。これは、性別と政党の好みの間に関連性があると言える十分な証拠がないことを意味します。
言い換えれば、性別と政党の好みは独立しています。