ロジスティック回帰の 6 つの仮説 (例付き)


ロジスティック回帰は、 応答変数がバイナリの場合に回帰モデルを近似するために使用できる方法です。

モデルをデータセットに適合させる前に、ロジスティック回帰では次の仮定が行われます。

仮定 #1: 応答変数はバイナリです

ロジスティック回帰では、応答変数には 2 つの可能な結果のみがあると想定されます。ここではいくつかの例を示します。

  • はい、もしくは、いいえ
  • 男性か女性
  • 成功するか失敗するか
  • 書かれたか書かれていない
  • 悪性か良性か

この仮定を確認する方法:応答変数で発生する一意の結果の数を単純に数えます。考えられる結果が 3 つ以上ある場合は、代わりに順序回帰を実行する必要があります。

仮説 #2: 観測値は独立している

ロジスティック回帰では、データセット内の観測値が互いに独立していると仮定します。つまり、観察結果は、同じ個人の繰り返しの測定から得られたものであってはならず、また、いかなる形であっても相互に関連するものであってはなりません。

この仮説をテストする方法:この仮説をテストする最も簡単な方法は、残差対時間 (つまり、観測順序) のプロットを作成し、ランダムな傾向があるかどうかを観察することです。ランダムなパターンがない場合、この仮定が破られる可能性があります。

仮説 #3: 説明変数間に多重共線性はない

ロジスティック回帰は、 説明変数間に重大な多重共線性がないことを前提としています。

多重共線性は、2 つ以上の説明変数が相互に高度に相関しており、回帰モデル内で固有または独立した情報を提供しない場合に発生します。変数間の相関度が十分に高い場合、モデルのフィッティングと解釈の際に問題が発生する可能性があります。

たとえば、最大垂直ジャンプを応答変数として、次の変数を説明変数として使用してロジスティック回帰を実行するとします。

  • プレーヤーのサイズ
  • プレーヤーのサイズ
  • 1日あたりの練習時間

この場合、背の高い人は靴のサイズが大きい傾向があるため、身長と靴のサイズには高い相関関係があると考えられます。これは、回帰でこれら 2 つの変数を使用すると、多重共線性が問題になる可能性が高いことを意味します。

この仮定を確認する方法:多重共線性を検出する最も一般的な方法は、回帰モデル内の予測変数間の相関と相関の強さを測定する分散膨張係数 (VIF) を使用することです。 VIF 値の計算および解釈方法の詳細な説明については、 このチュートリアルを参照してください。

仮定 #4: 極端な外れ値は存在しない

ロジスティック回帰では、データセットに極端な外れ値や影響力のある観測値がないことが前提となります。

この仮定を確認する方法:データセット内の極端な外れ値や影響力のある観測値をテストする最も一般的な方法は、各観測値のクック距離を計算することです。実際に外れ値がある場合は、(1) 外れ値を削除する、(2) 平均値や中央値などの値で置き換える、または (3) 単純に外れ値をモデル内に保持し、回帰をレポートするときにそれらをメモする、のいずれかを選択できます。 。結果。

仮説 #5: 説明変数と応答変数のロジットの間には線形関係がある

ロジスティック回帰では、各説明変数と応答変数のロジットの間に線形関係があると仮定します。ロジットが次のように定義されていることを思い出してください。

Logit(p) = log(p / (1-p)) ここで、p は肯定的な結果の確率です。

この仮説をテストする方法:この仮説が正しいかどうかを確認する最も簡単な方法は、Box-Tidwell テストを使用することです。

仮定 #6: サンプルサイズは十分に大きい

ロジスティック回帰では、データセットのサンプル サイズが、近似されたロジスティック回帰モデルから有効な結論を引き出すのに十分な大きさであることを前提としています。

この仮説を確認する方法:経験則として、各説明変数について、結果の頻度が最も低いケースが少なくとも 10 件存在する必要があります。たとえば、説明変数が 3 つあり、最小頻度の結果の期待確率が 0.20 の場合、サンプル サイズは少なくとも (10*3) / 0.20 = 150である必要があります。

ロジスティック回帰の仮定と線形回帰

線形回帰とは異なり、ロジスティック回帰では以下が必要ありません。

  • 説明変数と応答変数の間の線形関係。
  • 正規分布されるモデルの残差。
  • 残差には、等分散性とも呼ばれる一定の分散がなければなりません。

関連: 線形回帰の 4 つの仮定

追加リソース

現実の生活でロジスティック回帰を使用する 4 つの例
SPSS でロジスティック回帰を実行する方法
Excel でロジスティック回帰を実行する方法
Stata でロジスティック回帰を実行する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です