2 つの roc 曲線を比較する方法 (例あり)


機械学習における分類モデルのパフォーマンスを視覚化する 1 つの方法は、「受信機動作特性」曲線を表すROC 曲線を作成することです。

このタイプの曲線は、分類モデルの感度特異度を示します。

  • 感度:結果が実際に肯定的な場合に、モデルが観測値に対して肯定的な結果を予測する確率。
  • 特異性:結果が実際には陰性である場合に、モデルが観測に対して陰性の結果を予測する確率。

ROC 曲線のx 軸は(1-特異性)を表し、 y 軸は感度を表します。

ROC 曲線がプロットの左上隅に近ければ近いほど、モデルはデータをより適切にカテゴリに分類できます。

これを定量化するには、プロットのどの程度が曲線の下にあるかを示すAUC (曲線下面積) を計算します。

AUC が 1 に近づくほど、モデルは優れています。

どちらの分類モデルが優れているかを判断するために 2 つの ROC 曲線を比較する場合、多くの場合、どちらの ROC 曲線がプロットの左上隅により近く「密着」しており、したがって AUC 値がより高いかに注目します。

例: 2 つの ROC 曲線を比較する方法

ロジスティック回帰モデルと勾配強調モデルをデータセットに適合させて、応答変数の結果を予測するとします。

次に、ROC 曲線を作成して各モデルのパフォーマンスを視覚化するとします。

2 つの ROC 曲線を比較する

青い線はロジスティック回帰モデルの ROC 曲線を示し、オレンジ色の線は勾配ブースト モデルの ROC 曲線を示します。

グラフから、各モデルの次の AUC 値がわかります。

  • ロジスティック回帰モデルの AUC: 0.7902
  • 勾配ブースト モデルの AUC: 0.9712

勾配改善モデルの AUC 値はより高いため、応答変数の結果をより適切に予測すると言えます。

: この例では 2 つの ROC 曲線のみを比較しましたが、複数の異なる分類モデルをデータセットに適合させ、さらに多くの ROC 曲線を比較して、使用する最適なモデルを決定することも可能です。

追加リソース

次のチュートリアルでは、分類モデルと ROC 曲線に関する追加情報を提供します。

ロジスティック回帰の概要
ROC 曲線を解釈する方法
AUC スコアはどれくらいが良いと考えられますか?

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です