カイ二乗適合度検定: 定義、公式、例
カイ二乗適合度検定は、カテゴリ変数が仮説分布に従うかどうかを判断するために使用されます。
このチュートリアルでは次について説明します。
- カイ二乗適合度検定を実行する動機。
- カイ二乗適合度検定を実行するための公式。
- カイ二乗適合度検定を実行する方法の例。
カイ二乗適合度テスト: モチベーション
カイ二乗適合度検定は、さまざまな状況で使用できます。ここではいくつかの例を示します。
- サイコロが正しいかどうかを知りたいので、サイコロを 50 回振って、それぞれの数字に何回出たかを記録します。
- 私たちは、曜日ごとに同じ数の人が店に入店するかどうかを知りたいと考えています。そこで、ランダムな週に毎日入場する人の数を数えます。
- 袋に含まれる M&M の割合が、黄色 20%、青 30%、赤 30%、その他 20% であるかどうかを知りたいと考えています。これをテストするために、M&M’s の袋をランダムに開け、各色が何個入っているかを数えます。
これらの各シナリオでは、変数が仮説分布に従うかどうかを知りたいと考えています。各シナリオでは、カイ 2 乗適合度検定を使用して、変数の各レベルで予想されるカウント数と、観測されたカウント数に統計的に有意な差があるかどうかを判断できます。
カイ二乗適合度検定: 式
カイ二乗適合度検定では、次の帰無仮説と対立仮説が使用されます。
- H 0 : (帰無仮説)変数は仮説の分布に従います。
- H 1 : (対立仮説)変数は仮説の分布に従いません。
次の式を使用してカイ二乗 x 2検定統計量を計算します。
X 2 = Σ(OE) 2 / E
金:
- Σ: 「和」を意味する派手な記号
- ○:実測値
- E:期待値
p 値が検定統計量 05 および 0.01 に対応する場合、帰無仮説を棄却できます。
カイ二乗適合度検定: 例
店主は、毎日同じ数の顧客が店に来ると言いました。この仮説を検証するために、独立した研究者が特定の週に店舗に来店する顧客の数を記録し、次のことを発見しました。
- 月曜日: 50 人の顧客
- 火曜日:お客様60名
- 水曜日:お客様40名
- 木曜日:お客様47名
- 金曜日: 53名のお客様
次の手順を使用してカイ二乗適合度検定を実行し、データが店舗所有者の主張と一致しているかどうかを判断します。
ステップ 1: 前提条件を定義します。
次の仮定を使用して、カイ二乗適合度検定を実行します。
- H 0 :毎日同じ数の顧客が店舗に入ります。
- H 1 :毎日同じ数の顧客が来店するわけではありません。
ステップ 2: 毎日の (OE) 2 /E を計算します。
1週間で合計250人の顧客が来店した。したがって、毎日同じ量が到着すると予想した場合、毎日の期待値「E」は 50 になります。
- 月曜日: (50-50) 2 / 50 = 0
- 火曜日: (60-50) 2 / 50 = 2
- 水曜日: (40-50) 2 / 50 = 2
- 木曜日: (47-50) 2/50 = 0.18
- 金曜日: (53-50) 2/50 = 0.18
ステップ3 : 検定統計量を計算する
X 2 = Σ(OE) 2 / E = 0 + 2 + 2 + 0.18 + 0.18 = 4.36
ステップ 4: 検定統計量X2の p 値を計算します。
P 値計算機のカイ 2 乗スコアによると、X 2 = 4.36 および n-1 = 5-1 = 4 自由度に関連付けられた p 値は0.359472です。
ステップ 5: 結論を導き出します。
この p 値は 0.05 未満ではないため、帰無仮説を棄却できません。これは、顧客の本当の分布が店主が報告したものと異なると言える十分な証拠がないことを意味します。
注: カイ二乗適合度検定計算ツールを使用するだけで、この検定全体を完了することもできます。
追加リソース
次のチュートリアルでは、さまざまな統計プログラムを使用してカイ二乗適合度検定を実行する方法を説明します。
Excel でカイ 2 乗適合検定を実行する方法
Stata でカイ二乗適合度テストを実行する方法
SPSS でカイ二乗適合度検定を実行する方法
Python でカイ二乗適合度検定を実行する方法
R でカイ二乗適合度検定を実行する方法
TI-84 計算機でのカイ 2 乗フィット テスト
カイ二乗適合度検定計算機