Google スプレッドシートでのカイ二乗適合テスト (ステップバイステップ)
カイ二乗適合度検定は、カテゴリ変数が仮説分布に従うかどうかを判断するために使用されます。
たとえば、店のオーナーが、毎日同じ数の顧客が店に来ると主張するとします。
この仮説を検証するために、独立した研究者が特定の週に店舗に来店する顧客の数を記録し、次のことを発見しました。
- 月曜日: 50 人の顧客
- 火曜日:お客様60名
- 水曜日:お客様40名
- 木曜日:お客様47名
- 金曜日: 53名のお客様
カイ二乗適合度検定を実行して、データが店主の主張と一致しているかどうかを判断できます。
このステップバイステップの例では、Google スプレッドシートでカイ 2 乗適合度検定を実行する方法を示します。
ステップ 1: データを作成する
まず、次の形式で Google スプレッドシートにデータを入力しましょう。
注:顧客は合計 250 人でした。店主が毎日同じ数の顧客が店に入ると予想した場合、1 日あたり 50 人の顧客が来ると予想します。
ステップ 2: 観測値と期待値の差を計算する
適合度検定のカイ二乗検定統計量は、X 2 = Σ(OE) 2 / Eです。
金:
- Σ: 「和」を意味する派手な記号
- ○:実測値
- E:期待値
次の式は、各行の(OE) 2 /Eを計算する方法を示しています。
ステップ 3: P 値を計算する
最後に、次の式を使用して、カイ二乗検定統計量と対応する p 値を計算します。
注: CHISQ.DIST.RT(x, deg_freedom)関数は、検定統計量xと特定の自由度に関連付けられたカイ二乗分布の正しい確率を返します。自由度は n-1 として計算されます。この場合、deg_freedom = 5 – 1 = 4 となります。
この検定のX2検定統計量は4.36で、対応する p 値は0.3595です。
この p 値は 0.05 未満ではないため、帰無仮説を棄却できません。これは、顧客の本当の分布が店主が報告したものと異なると言える十分な証拠がないことを意味します。