什么被认为是良好的 auc 分数?


逻辑回归是当响应变量是二元时我们用来拟合回归模型的方法。

为了评估逻辑回归模型对数据集的拟合程度,我们可以查看以下两个指标:

  • 敏感性:当结果实际上是积极的时,模型预测观察结果为积极的概率。这也称为“真阳性率”。
  • 特异性:当结果实际上为负时,模型预测观察结果为负的概率。这也称为“真负率”。

可视化这两个测量值的一种方法是创建ROC 曲线,它代表“接收器操作特性”曲线。

该图沿 y 轴显示灵敏度,沿 x 轴显示(1 – 特异性)。

量化逻辑回归模型在数据分类方面的有效性的一种方法是计算AUC ,它代表“曲线下面积”。

AUC 值的范围从 0 到 1。AUC 为 1 的模型能够完美地将观察结果分类,而 AUC 为 0.5 的模型并不比进行随机猜测的模型更好。

什么是好的 AUC 分数?

关于AUC,学生经常问的一个问题是:

什么是好的 AUC 分数?

答案:

对于什么是好的 AUC 分数,没有具体的阈值

显然,AUC 分数越高,模型将观察结果分类的能力就越强。

我们知道,AUC 分数为 0.5 的模型并不比随机猜测的模型更好。

然而,没有神奇的数字来确定 AUC 分数的好坏。

如果我们需要将某些分数分类为好或坏,我们可以参考 Hosmer 和 LemeshowApplied Logistic Regression (p. 177) 中以下经验法则

  • 0.5 = 没有歧视
  • 0.5-0.7 = 不好的辨别力
  • 0.7-0.8 = 可接受的歧视
  • 0.8-0.9 = 出色的辨别力
  • >0.9 = 异常歧视

根据这些标准,AUC 分数低于 0.7 的模型将被视为较差,任何更高的模型将被视为可接受或更好。

“良好”的 AUC 分数因行业而异

请务必记住,“良好”AUC 分数的定义因行业而异。

例如,在医学领域,研究人员经常寻找 AUC 分数高于 0.95 的分数,因为犯错误的成本非常高。

例如,如果我们有一个逻辑回归模型来预测患者是否会患上癌症,那么犯错误(错误地告诉患者他们没有患癌症,然后他患有癌症)的成本非常高,以至于我们想要几乎每次都正确的模型。

相反,在营销等其他行业,模型可以接受较低的 AUC 分数。

例如,如果我们有一个模型可以预测客户是否会成为回头客,那么错误的代价不会改变生活,因此 AUC 低至 0.6 的模型仍然有用。

将 AUC 分数与当前模型进行比较

在现实世界中,我们经常将新逻辑回归模型的 AUC 分数与当前使用的模型的 AUC 分数进行比较。

例如,假设一家公司使用逻辑回归模型来预测客户是否会成为回头客。

如果当前模型的 AUC 分数为 0.6,而您开发了一个 AUC 为 0.65 的新模型,那么您开发的新模型将是更可取的,即使它只提供了轻微的改进,并且会被 Hosmer 和 Lemeshow 视为“差”标准。

其他资源

以下教程提供了有关如何创建和解释 ROC 曲线和 AUC 分数的更多信息:

如何解释 ROC 曲线(附示例)
如何在 Python 中创建 ROC 曲线
如何在 R 中创建 ROC 曲线
如何在R中计算AUC

添加评论

您的邮箱地址不会被公开。 必填项已用 * 标注