ピアソン残差とは何ですか? (定義&例)
ピアソン残差は独立性のカイ二乗検定で使用され、分割表で観察された細胞数と予想される細胞数の差を分析します。
ピアソン残差を計算する式は次のとおりです。
r ij = (O ij – E ij ) / √ E ij
金:
- r ij : i番目の列と j番目の行のセルのピアソン残差
- O ij : i列目、j行目のセルで観測された値
- E ij : i列目、j行目のセルの期待値
同様の尺度は標準化された (調整された) ピアソン残差であり、次のように計算されます。
r ij = (O ij – E ij ) / √ E ij (1-n i+ )(1-n +j )
金:
- r ij : i番目の列と j番目の行のセルのピアソン残差
- O ij : i列目、j行目のセルで観測された値
- E ij : i列目、j行目のセルの期待値
- p i+ : 行の合計を総計で割った値
- p + j : 列合計を総計で割った値
標準化ピアソン残差は、平均 0、標準偏差 1 で正規分布します。絶対値が特定のしきい値 (2 または 3 など) を超える標準化ピアソン残差は、適合性の欠如を示します。
次の例は、実際にピアソン残差を計算する方法を示しています。
例: ピアソン残差の計算
研究者らが独立性のカイ二乗検定を使用して、性別が政党の好みと関連しているかどうかを判断したいと考えているとします。
彼らは、500 人の有権者から単純に無作為にサンプルを抽出し、政党の好みについて尋ねることにしました。
次の分割表は、調査の結果を示しています。
共和党 | 民主党 | 独立した | 合計 | |
男 | 120 | 90 | 40 | 250 |
女性 | 110 | 95 | 45 | 250 |
合計 | 230 | 185 | 85 | 500 |
ピアソン残差を計算する前に、まず分割表の各セルの予想カウントを計算する必要があります。これを行うには、次の式を使用できます。
期待値 = (行の合計 * 列の合計) / テーブルの合計。
たとえば、共和党員男性の期待値は (230*250) / 500 = 115です。
この式を繰り返すと、テーブルの各セルの期待値を取得できます。
共和党 | 民主党 | 独立した | 合計 | |
男 | 115 | 92.5 | 42.5 | 250 |
女性 | 115 | 92.5 | 42.5 | 250 |
合計 | 230 | 185 | 85 | 500 |
次に、テーブル内の各セルのピアソン残差を計算できます。
たとえば、共和党員の男性が含まれるセルのピアソン残差は次のように計算されます。
- r ij = (O ij – E ij ) / √ E ij
- r ij = (120 – 115) / √ 115
- r ij = 0.466
この式を繰り返すと、テーブル内の各セルのピアソン残差を取得できます。
共和党 | 民主党 | 独立した | |
男 | 0.446 | -0.259 | -0.383 |
女性 | -0.446 | 0.259 | 0.383 |
次に、テーブル内の各セルの標準化されたピアソン残差を計算できます。
たとえば、共和党員の男性を含むセルの標準化されたピアソン残差は次のように計算されます。
- r ij = (O ij – E ij ) / √ E ij (1-p i+ )(1-p +j )
- r ij = (120 – 115) / √ 115(1-250/500)(1-230/500)
- r ij = 0.897
この式を繰り返すと、テーブル内の各セルの標準化されたピアソン残差を取得できます。
共和党 | 民主党 | 独立した | |
男 | 0.897 | -0.463 | -0.595 |
女性 | -0.897 | 0.463 | 0.595 |
標準化されたピアソン残差の絶対値が 3 を超えるものがないことがわかります。これは、どのセルも適合の重大な欠如に寄与していないことを示しています。
このオンライン計算機を使用して独立性のカイ二乗検定を実行すると、検定の p 値が0.649198であることがわかります。
この p 値は 0.05 未満ではないため、性別と政党の好みの間に関連があると言える十分な証拠はありません。
追加リソース
次のチュートリアルでは、さまざまな統計ソフトウェアを使用して独立性のカイ二乗検定を実行する方法を説明します。
カイ二乗独立性検定の概要
Excel でカイ二乗独立性検定を実行する方法
R でカイ二乗独立性検定を実行する方法
独立性計算機のカイ二乗検定