Spss で roc 曲線を作成および解釈する方法


ロジスティック回帰は、応答変数がバイナリの場合に回帰モデルを近似するために使用する統計手法です。ロジスティック回帰モデルがデータセットにどの程度適合しているかを評価するには、次の 2 つの指標を確認します。

  • 感度:結果が実際に肯定的な場合に、モデルが観測値に対して肯定的な結果を予測する確率。
  • 特異性:結果が実際には陰性である場合に、モデルが観測値に対して陰性の結果を予測する確率。

これら 2 つの指標を視覚化する簡単な方法は、ロジスティック回帰モデルの感度と特異度を表示するグラフであるROC 曲線 を作成することです。

このチュートリアルでは、SPSS で ROC 曲線を作成および解釈する方法を説明します。

例: SPSS の ROC 曲線

バスケットボール選手が NBA にドラフトされたかどうか (0 = いいえ、1 = はい) と、大学での 1 試合あたりの平均得点を示す次のデータ セットがあるとします。

このデータセットの ROC 曲線を作成するには、 [分析]タブ、 [分類][ROC 曲線] の順にクリックします。

表示される新しいウィンドウで、ドラフト変数を「状態変数」というラベルの付いた領域にドラッグします。状態変数の値を1に設定します。 (これは、プレーヤーがドラフトされたことを示す値です)。変数ポイントを「テスト変数」というラベルの付いた領域にドラッグします。

[対角基準線ROC 曲線点座標あり] の横のボックスをオンにします。次に、 「OK」をクリックします。

結果を解釈する方法は次のとおりです。

ファイル処理の概要:

この表には、データセット内の陽性ケースと陰性ケースの合計数が表示されます。この例では、8 人のプレーヤーがドラフトされ (肯定的な結果)、6 人のプレーヤーがドラフトされませんでした (否定的な結果)。

SPSS での ROC 曲線の解釈

ROC 曲線:

受信者動作特性 (ROC) 曲線は、しきい値が 0 から 1 に変化するときの感度値と特異度 1 のプロットです。

SPSS の ROC 曲線

感度と特異性が高いモデルは、プロットの左上隅に適合する ROC 曲線を持ちます。感度と特異性が低いモデルは、対角 45 度に近い曲線になります。

この例の ROC 曲線 (青い線) がプロットの左上隅に沿っていることがわかります。これは、モデルが 1 試合あたりの平均得点に基づいて、ドラフトに指名されるかどうかを選手を予測するのに適切に機能していることを示しています。 。 。

曲線の下の面積:

曲線の下の領域は、肯定的な結果と否定的な結果を区別するモデルの能力のアイデアを与えてくれます。 AUC の範囲は 0 から 1 です。AUC が高いほど、モデルは結果を正しく分類できます。

SPSS の ROC 曲線上の AUC

この特定のロジスティック回帰モデルの AUC は0.948であり、非常に高いことがわかります。これは、このモデルがプレーヤーがドラフトされるかどうかを適切に予測していることを示しています。

曲線の座標:

この最後の表には、さまざまなしきい値に対する ROC 曲線の感度と特異度 1 が表示されます。

SPSS のロジスティック回帰における曲線座標の解釈

例えば:

しきい値を8.50にする場合、これは、1 試合あたりの得点が 8.50 未満のプレーヤーはドラフトされず、1 試合あたりの得点が 8.50 を超えるプレーヤーはドラフトされると予想されることを意味します。

これをしきい値として使用すると、感度は100% (1 試合あたりの得点が 8.50 未満のプレーヤーは実際にドラフトされなかったため)、特異性 1 は66.7%になります (12 人中 8 人のプレーヤーが 8.50 点以上を獲得したため)試合ごとにドラフトされた)。

上の表では、潜在的なしきい値ごとの感度と特異度 1 を確認できます。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です