R でのカイ二乗独立性検定 (例付き)
独立性のカイ二乗検定は、 2 つのカテゴリ変数間に有意な関連があるかどうかを判断するために使用されます。
このチュートリアルでは、R で独立性のカイ二乗検定を実行する方法について説明します。
例: R での独立性のカイ二乗検定
性別が政党の好みと関連しているかどうかを知りたいとします。私たちは 500 人の有権者から単純に無作為にサンプルを採取し、彼らの政党の好みについて尋ねます。次の表は、調査の結果を示しています。
共和党 | 民主党 | 独立した | 合計 | |
男 | 120 | 90 | 40 | 250 |
女性 | 110 | 95 | 45 | 250 |
合計 | 230 | 185 | 85 | 500 |
次の手順を使用して、R で独立性のカイ二乗検定を実行し、性別が政党の好みに関連しているかどうかを判断します。
ステップ 1: データを作成します。
まず、データを保持するテーブルを作成します。
#create table data <- matrix(c(120, 90, 40, 110, 95, 45), ncol= 3 , byrow= TRUE ) colnames(data) <- c(" Rep "," Dem "," Ind ") rownames(data) <- c(" Male "," Female ") data <- as.table (data) #view table data Rep Dem Ind Male 120 90 40 Female 110 95 45
ステップ 2: 独立性のカイ二乗検定を実行します。
次に、 chisq.test()関数を使用してカイ二乗独立性検定を実行できます。
#Perform Chi-Square Test of Independence
chisq.test(data)
Pearson's Chi-squared test
data:data
X-squared = 0.86404, df = 2, p-value = 0.6492
結果を解釈する方法は次のとおりです。
- カイ二乗検定統計量: 0.86404
- 自由度: 2 (#rows-1 * #columns-1 として計算)
- p値: 0.6492
独立性のカイ二乗検定では次の帰無仮説と対立仮説が使用されることを思い出してください。
- H 0 : (帰無仮説) 2 つの変数は独立しています。
- H 1 : (対立仮説) 2 つの変数は独立していません。
検定の p 値 (0.6492) は 0.05 未満ではないため、帰無仮説を棄却できません。これは、性別と政党の好みの間に関連性があると言える十分な証拠がないことを意味します。
言い換えれば、性別と政党の好みは独立しています。
追加リソース
カイ二乗独立性検定の概要
独立性計算機のカイ二乗検定
R のカイ二乗統計量の P 値を計算する方法
R の臨界カイ二乗値を見つける方法