Excel 中的 box-cox 变换(分步)
Box-Cox 变换是将非正态分布的数据集变换为更正态分布的数据集的常用方法。
基本思想是使用以下公式找到 λ 值,使变换后的数据尽可能接近正态分布:
- y(λ) = (y λ – 1) / λ 如果 y ≠ 0
- y(λ) = log(y) 如果 y = 0
以下分步示例演示如何对 Excel 中的数据集执行 box-cox 转换。
第 1 步:输入数据
让我们从输入数据集中的值开始:
第 2 步:对数据进行排序
然后创建索引列和排序数据列:
步骤 3:为 Lambda 选择任意值
接下来,我们将为 lambda 选择任意值 1,并对数据应用临时 box-cox 变换:
第 4 步:计算 Z 分数
接下来,我们将计算每个索引值的 z 分数:
然后我们将计算 box-cox 变换值和 z 分数之间的相关性:
第 5 步:找到最佳 Lambda 值
接下来,我们将使用 Goal Seek 来查找要在 box-cox 变换中使用的最佳 lambda 值。
为此,请单击顶部功能区的“数据”选项卡。然后单击预测组中的假设分析。
在下拉菜单中,单击“目标搜索”并填写以下值:
单击确定后,Goal Seek 将自动查找最佳 lambda 值,即-0.5225 。
第 6 步:执行 Box-Cox 变换
最后,我们将使用 -0.5225 的 lambda 值对原始数据应用 box-cox 变换:
额外奖励:我们可以通过在 Excel 中执行 Jarque-Bera 测试来确认转换后的数据呈正态分布。