Stata でロジスティック回帰を実行する方法


ロジスティック回帰は、応答変数がバイナリの場合に回帰モデルを近似するために使用する方法です。ロジスティック回帰の使用例をいくつか示します。

  • 私たちは、運動、食事、体重が心臓発作の可能性にどのような影響を与えるかを知りたいと考えています。応答変数は心臓発作であり、心臓発作が起こるか起こらないかという 2 つの潜在的な結果があります。
  • GPA、ACT スコア、および受講した AP コースの数が、特定の大学に合格する可能性にどのような影響を与えるかを知りたいと考えています。応答変数は受け入れであり、受け入れられるか受け入れられないという 2 つの潜在的な結果があります。
  • 私たちは、単語数と電子メールのタイトルが電子メールがスパムである可能性に影響を与えるかどうかを知りたいと考えています。応答変数はスパムであり、スパムか非スパムかの 2 つの結果が考えられます。

このチュートリアルでは、Stata でロジスティック回帰を実行する方法を説明します。

例: Stata のロジスティック回帰

母親の年齢と喫煙習慣が低出生体重児を産む可能性に影響を与えるかどうかを知りたいとします。

これを調べるために、年齢と喫煙 (はいまたはいいえ) を説明変数として、低出生体重 (はいまたはいいえ) を応答変数として使用して、ロジスティック回帰を実行できます。応答変数はバイナリであるため、考えられる結果は 2 つだけなので、ロジスティック回帰を使用する必要があります。

Stata で次の手順を実行し、189 個の異なる母親に関するデータを含むlbwというデータセットを使用してロジスティック回帰を実行します。

ステップ 1: データをロードします。

コマンド ボックスに次のように入力してデータをロードします。

https://www.stata-press.com/data/r13/lbw を使用してください

ステップ 2: データの概要を取得します。

コマンド ボックスに次のように入力すると、作業しているデータをすばやく理解できます。

要約する

Stata の低出生体重児データセット

データセットには 11 の異なる変数があることがわかりますが、関心があるのは次の 3 つだけです。

  • low – 赤ちゃんの出生体重が低いかどうか。 1 = はい、0 = いいえ。
  • 年齢– 母親の年齢。
  • 喫煙– 母親が妊娠中に喫煙したかどうか。 1 = はい、0 = いいえ。

ステップ 3: ロジスティック回帰を実行します。

コマンド ボックスに次のように入力して、年齢煙を説明変数として、低濃度を応答変数として使用してロジスティック回帰を実行します。

低年齢煙ロジット

Stata のロジスティック回帰出力

結果内の最も興味深い数値を解釈する方法は次のとおりです。

係数 (年齢): -.0497792。煙を一定に保つと、年齢が上がるごとに、赤ちゃんが低出生体重児になる確率が exp(-0.0497792) = 0.951 増加します。この数値が 1 未満であるということは、実際には年齢の増加が低出生体重児を産む可能性の減少と関連していることを意味します。

たとえば、母親 A と母親 B が両方とも喫煙しているとします。母親 A が母親 B より 1 歳年上である場合、母親 A が低出生体重児を産む確率は、母親 B が低出生体重児を産む確率の 95.1% にすぎません。誕生。

P>|z| (年齢): 0.119。これは、 ageの検定統計量に関連付けられた p 値です。この値は 0.05 未満ではないため、年齢は統計的に有意な低出生体重の予測因子ではありません。

オッズ比 (煙): 0.6918486。年齢を一定に保つと、妊娠中に喫煙する母親は、妊娠中に喫煙しない母親よりも低出生体重児を出産する確率が exp(.6918486) = 1.997 高くなります。

たとえば、母親Aと母親Bはどちらも30歳だとします。母親 A が妊娠中に喫煙し、母親 B が喫煙しない場合、母親 A が低出生体重児を生む確率は、母親 B が低出生体重児を生む確率より 99.7% 高くなります。

P>|z| (煙): 0.032。これは、の検定統計量に関連付けられた p 値です。この値は 0.05 未満であるため、喫煙は統計的に有意な低出生体重の予測因子となります。

ステップ 4: 結果を報告します。

最後に、ロジスティック回帰の結果を報告したいと思います。これを行う方法の例を次に示します。

母親の年齢と喫煙習慣が低出生体重児の出産の可能性に影響を与えるかどうかを判断するために、ロジスティック回帰が実行されました。分析には 189 人の母親のサンプルが使用されました。

その結果、喫煙と低出生体重児の確率との間には統計的に有意な関係がある(z = 2.15、p = 0.032)一方、年齢と低出生体重児の確率の間には統計的に有意な関係はなかった(z = -1.56)ことが示されました。 、p = 0.032)。 119)。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です