Auc スコアはどれくらいが良いと考えられますか?

によるベンジャミン・アンダーソン博士 7月 23, 2023 ガイド 0コメント

ロジスティック回帰は、応答変数がバイナリの場合に回帰モデルを近似するために使用する方法です。

ロジスティック回帰モデルがデータセットにどの程度適合しているかを評価するには、次の 2 つの指標を確認します。

これら 2 つの測定値を視覚化する 1 つの方法は、「受信機動作特性」曲線を表すROC 曲線を作成することです。

これは、感度を Y 軸に、(1 – 特異度) を X 軸に示したグラフです。

データの分類におけるロジスティック回帰モデルの有効性を定量化する 1 つの方法は、「曲線の下の面積」を表すAUCを計算することです。

AUC 値の範囲は 0 ～ 1 です。AUC が 1 のモデルは観測値をクラスに完全に分類できますが、AUC が 0.5 のモデルはランダムな推測を行うモデルと同じです。

AUC について学生がよく尋ねる質問は次のとおりです。

適切な AUC スコアとは何ですか?

答え：

良好な AUC スコアとみなされる値に特定のしきい値はありません。

明らかに、AUC スコアが高いほど、モデルが観測値をクラスに分類する能力が高くなります。

そして、AUC スコアが 0.5 のモデルは、ランダムな推測を行うモデルと同等であることがわかっています。

ただし、AUC スコアが良いか悪いかを判断するための魔法の数字はありません。

特定のスコアを良いか悪いかを分類する必要がある場合は、Hosmer と Lemeshowの『応用ロジスティック回帰(p. 177)』の次の経験則を参照できます。

これらの基準によれば、AUC スコアが 0.7 未満のモデルは不良とみなされ、それ以上のモデルは許容範囲または優れているとみなされます。

何が「良好」な AUC スコアとみなされるかは業界によって異なることに留意することが重要です。

たとえば、医療分野では、間違いを犯した場合のコストが非常に高いため、研究者は 0.95 を超える AUC スコアを探すことがよくあります。

たとえば、患者ががんを発症するかどうかを予測するロジスティック回帰モデルがある場合、間違いを犯した場合のコスト（患者にがんではないのにがんがあると誤って告げる）が非常に高くなるため、ほぼ毎回正しいモデルです。

逆に、マーケティングなどの他の業界では、モデルの AUC スコアが低くても許容される場合があります。

たとえば、顧客がリピーターになるかどうかを予測するモデルがある場合、間違いの代償は人生を変えるものではないため、AUC が 0.6 という低いモデルでも依然として有用である可能性があります。

実際の設定では、新しいロジスティック回帰モデルの AUC スコアと、現在使用されているモデルの AUC スコアを比較することがよくあります。

たとえば、企業がロジスティック回帰モデルを使用して、顧客がリピート顧客になるかどうかを予測するとします。

現在のモデルの AUC スコアが 0.6 で、AUC が 0.65 の新しいモデルを開発した場合、たとえわずかな改善しか得られず、Hosmer と Lemeshow によって「悪い」とみなされるとしても、開発した新しいモデルの方が望ましいでしょう。規格。

次のチュートリアルでは、ROC 曲線と AUC スコアを作成および解釈する方法に関する追加情報を提供します。

私はベンジャミンです。退職した統計教授から、専任の Statorials 教育者になりました。統計分野における豊富な経験と専門知識を活かして、私は Statorials を通じて学生に力を与えるために自分の知識を共有することに尽力しています。もっと知る