如何解释 roc 曲线（附示例）

经过本杰明·安德森博 7月 23, 2023 指导 0 条评论

逻辑回归是一种统计方法，当响应变量是二元时，我们用它来拟合回归模型。为了评估逻辑回归模型对数据集的拟合程度，我们可以查看以下两个指标：

可视化这两个指标的一个简单方法是创建ROC 曲线，它是显示逻辑回归模型的敏感性和特异性的图表。

本教程介绍如何创建和解释 ROC 曲线。

一旦我们拟合了逻辑回归模型，我们就可以使用该模型将观察结果分为两类之一。

例如，我们可以将观察结果分类为“正面”或“负面”。

真阳性率表示实际应该为阳性的观察结果的比例。

相反，假阳性率表示应该为阳性但实际上为阴性的观察结果的比例。

当我们创建 ROC 曲线时，我们为逻辑回归模型的每个可能的决策阈值绘制真阳性率与假阳性率对。

ROC 曲线越接近图的左上角，模型就越能将数据分类。

为了量化这一点，我们可以计算AUC （曲线下面积），它告诉我们有多少图位于曲线下。

AUC 越接近 1，模型越好。

AUC 等于 0.5 的模型将是一条完美的对角线，并且代表的模型并不比进行随机分类的模型更好。

计算多个逻辑回归模型的 AUC 特别有用，因为它使我们能够了解哪个模型最适合进行预测。

例如，假设我们拟合三个不同的逻辑回归模型，并为每个模型绘制以下 ROC 曲线：

假设我们计算每个模型的 AUC 如下：

模型 A 具有最高的 AUC，表明它具有最大的曲线下面积，是正确将观测结果分类的最佳模型。

以下教程解释了如何使用不同的统计软件创建 ROC 曲线：

大家好，我是本杰明，一位退休的统计学教授，后来成为 Statorials 的热心教师。凭借在统计领域的丰富经验和专业知识，我渴望分享我的知识，通过 Statorials 增强学生的能力。了解更多