Spss で roc 曲線を作成および解釈する方法
ロジスティック回帰は、応答変数がバイナリの場合に回帰モデルを近似するために使用する統計手法です。ロジスティック回帰モデルがデータセットにどの程度適合しているかを評価するには、次の 2 つの指標を確認します。
- 感度:結果が実際に肯定的な場合に、モデルが観測値に対して肯定的な結果を予測する確率。
- 特異性:結果が実際には陰性である場合に、モデルが観測値に対して陰性の結果を予測する確率。
これら 2 つの指標を視覚化する簡単な方法は、ロジスティック回帰モデルの感度と特異度を表示するグラフであるROC 曲線 を作成することです。
このチュートリアルでは、SPSS で ROC 曲線を作成および解釈する方法を説明します。
例: SPSS の ROC 曲線
バスケットボール選手が NBA にドラフトされたかどうか (0 = いいえ、1 = はい) と、大学での 1 試合あたりの平均得点を示す次のデータ セットがあるとします。
このデータセットの ROC 曲線を作成するには、 [分析]タブ、 [分類] 、 [ROC 曲線] の順にクリックします。
表示される新しいウィンドウで、ドラフト変数を「状態変数」というラベルの付いた領域にドラッグします。状態変数の値を1に設定します。 (これは、プレーヤーがドラフトされたことを示す値です)。変数ポイントを「テスト変数」というラベルの付いた領域にドラッグします。
[対角基準線とROC 曲線点座標あり] の横のボックスをオンにします。次に、 「OK」をクリックします。
結果を解釈する方法は次のとおりです。
ファイル処理の概要:
この表には、データセット内の陽性ケースと陰性ケースの合計数が表示されます。この例では、8 人のプレーヤーがドラフトされ (肯定的な結果)、6 人のプレーヤーがドラフトされませんでした (否定的な結果)。
ROC 曲線:
受信者動作特性 (ROC) 曲線は、しきい値が 0 から 1 に変化するときの感度値と特異度 1 のプロットです。
感度と特異性が高いモデルは、プロットの左上隅に適合する ROC 曲線を持ちます。感度と特異性が低いモデルは、対角 45 度に近い曲線になります。
この例の ROC 曲線 (青い線) がプロットの左上隅に沿っていることがわかります。これは、モデルが 1 試合あたりの平均得点に基づいて、ドラフトに指名されるかどうかを選手を予測するのに適切に機能していることを示しています。 。 。
曲線の下の面積:
曲線の下の領域は、肯定的な結果と否定的な結果を区別するモデルの能力のアイデアを与えてくれます。 AUC の範囲は 0 から 1 です。AUC が高いほど、モデルは結果を正しく分類できます。
この特定のロジスティック回帰モデルの AUC は0.948であり、非常に高いことがわかります。これは、このモデルがプレーヤーがドラフトされるかどうかを適切に予測していることを示しています。
曲線の座標:
この最後の表には、さまざまなしきい値に対する ROC 曲線の感度と特異度 1 が表示されます。
例えば:
しきい値を8.50にする場合、これは、1 試合あたりの得点が 8.50 未満のプレーヤーはドラフトされず、1 試合あたりの得点が 8.50 を超えるプレーヤーはドラフトされると予想されることを意味します。
これをしきい値として使用すると、感度は100% (1 試合あたりの得点が 8.50 未満のプレーヤーは実際にドラフトされなかったため)、特異性 1 は66.7%になります (12 人中 8 人のプレーヤーが 8.50 点以上を獲得したため)試合ごとにドラフトされた)。
上の表では、潜在的なしきい値ごとの感度と特異度 1 を確認できます。