3 種類のロジスティック回帰 (例を含む)
ロジスティック回帰は、応答変数がカテゴリカルである回帰モデルを指します。
ロジスティック回帰モデルには 3 つのタイプがあります。
- バイナリ ロジスティック回帰: 応答変数は 2 つのカテゴリのいずれかにのみ属することができます。
- 多項ロジスティック回帰: 応答変数は 3 つ以上のカテゴリの 1 つに分類される可能性があり、カテゴリ間に自然な順序付けはありません。
- 順序ロジスティック回帰: 応答変数は 3 つ以上のカテゴリの 1 つに分類され、カテゴリ間には自然な順序が存在します。
次の表は、これらの違いをまとめたものです。
このチュートリアルでは、各タイプのロジスティック回帰モデルの簡単な説明と、それぞれの例を示します。
タイプ #1: バイナリ ロジスティック回帰
バイナリ ロジスティック回帰モデルは、応答変数が 2 つのカテゴリにのみ分類できるロジスティック回帰の一種です。
ここではいくつかの例を示します。
例 1: NBA ドラフト
スポーツ データ サイエンティストが、予測変数 (1) ポイント、(2) リバウンド、(3) アシストを使用して、特定の大学バスケットボール選手が NBA にドラフトされる可能性を予測したいとします。
応答変数の考えられる結果は 2 つだけ (書き込みまたは書き込みなし) であるため、データ サイエンティストは二項ロジスティック回帰モデルを使用します。
例 2: スパムの検出
企業が、予測変数 (1) 単語数と (2) 発信国を使用して、特定の電子メールがスパムである可能性を予測したいとします。
応答変数の考えられる結果は 2 つだけ (スパムまたは非スパム) であるため、同社は二項ロジスティック回帰モデルを使用します。
タイプ n°2: 多項ロジスティック回帰
多項ロジスティック回帰モデルは、応答変数が 3 つ以上のカテゴリの 1 つに分類されるロジスティック回帰の一種であり、カテゴリ間に自然な順序付けはありません。
ここではいくつかの例を示します。
例 1: 政治的好み
政治学者が、(1) 年収と (2) 学歴という予測変数を使用して、個人が 4 人の異なる大統領候補のうちの 1 人に投票する確率を予測したいとします。
応答変数には 2 つ以上の可能な結果 (潜在的な候補が 4 つあります) があり、結果間に自然な順序付けがないため、政治学者は多項ロジスティック回帰モデルを使用します。
例 2: スポーツの好み
スポーツ アナリストが予測変数 (1) 1 週間あたりのテレビ視聴時間と (2) 年齢を使用して、個人が好きなスポーツとしてバスケットボール、フットボール、または野球を選択する確率を予測したいとします。
応答変数には 2 つ以上の可能な結果 (スポーツが 3 つあります) があるため、スポーツ アナリストは多項ロジスティック回帰モデルを使用します。
タイプ #3: 順序ロジスティック回帰
順序ロジスティック回帰モデルは、応答変数が 3 つ以上のカテゴリの 1 つに分類され、カテゴリ間に自然な順序が存在するロジスティック回帰の一種です。
ここではいくつかの例を示します。
例 1: 学校の評価
大学のカウンセラーが、予測変数 (1) GPA、(2) ACT スコア、および (3) SAT スコアを使用して、個人が「悪い」または「平凡」に分類される大学に入学する可能性を予測したいとします。 。 »、「良い」または「素晴らしい」。
応答変数には 2 つ以上の可能な結果 (学校の質には 4 つの分類がある) があり、結果間には自然な順序があるため、スクールカウンセラーは順序ロジスティック回帰モデルを使用します。
例 2: 映画の評価
映画批評家が、予測変数 (1) 総上映時間と (2) ジャンルを使用して、特定の映画が 1 ~ 10 の評価を受ける確率を予測したいとします。
応答変数には 2 つ以上の可能な結果 (可能な評価は 10 個あります) があり、結果間には自然な順序があるため、映画批評家は順序ロジスティック回帰モデルを使用します。
追加リソース
次のチュートリアルでは、ロジスティック回帰モデルについて詳しく説明します。