Excel 中的 box-cox 变换（分步）

经过本杰明·安德森博 7月 25, 2023 指导 0 条评论

Box-Cox 变换是将非正态分布的数据集变换为更正态分布的数据集的常用方法。

基本思想是使用以下公式找到 λ 值，使变换后的数据尽可能接近正态分布：

以下分步示例演示如何对 Excel 中的数据集执行 box-cox 转换。

让我们从输入数据集中的值开始：

然后创建索引列和排序数据列：

接下来，我们将为 lambda 选择任意值 1，并对数据应用临时 box-cox 变换：

接下来，我们将计算每个索引值的 z 分数：

然后我们将计算 box-cox 变换值和 z 分数之间的相关性：

接下来，我们将使用 Goal Seek 来查找要在 box-cox 变换中使用的最佳 lambda 值。

为此，请单击顶部功能区的“数据”选项卡。然后单击预测组中的假设分析。

在下拉菜单中，单击“目标搜索”并填写以下值：

Excel 中的 Box-Cox 变换

单击确定后，Goal Seek 将自动查找最佳 lambda 值，即-0.5225 。

最后，我们将使用 -0.5225 的 lambda 值对原始数据应用 box-cox 变换：

额外奖励：我们可以通过在 Excel 中执行 Jarque-Bera 测试来确认转换后的数据呈正态分布。

大家好，我是本杰明，一位退休的统计学教授，后来成为 Statorials 的热心教师。凭借在统计领域的丰富经验和专业知识，我渴望分享我的知识，通过 Statorials 增强学生的能力。了解更多