如何标准化 -1 和 1 之间的数据

经过本杰明·安德森博 7月 13, 2023 指导 0 条评论

要将数据集中的值标准化在-1和1之间，可以使用以下公式：

z _i = 2 * ((x _i – x _min ) / (x _max – x _min )) – 1

金子：

例如，假设我们有以下数据集：

数据集中的最小值为 13，最大值为 71。

为了标准化13的第一个值，我们将应用之前共享的公式：

z _i = 2 * ((x _i – x _min ) / (x _max – x _min )) – 1 = 2 * ((13 – 13) / (71 – 13)) – 1 = -1

为了标准化16的第二个值，我们将使用相同的公式：

z _i = 2 * ((x _i – x _min ) / (x _max – x _min )) – 1 = 2 * ((16 – 13) / (71 – 13)) – 1 = -0.897

为了标准化第三个值19 ，我们将使用相同的公式：

z _i = 2 * ((x _i – x _min ) / (x _max – x _min )) – 1 = 2 * ((19 – 13) / (71 – 13)) – 1 = -0.793

我们可以使用这个完全相同的公式将原始数据集中的每个值标准化在 -1 和 1 之间：

标准化数据集中的每个值现在都在 -1 和 1 之间。

使用这种标准化方法，以下陈述将始终为真：

何时标准化数据

当我们进行某种类型的分析时，我们通常会标准化变量，在这种分析中，我们有多个在不同尺度上测量的变量，并且我们希望每个变量具有相同的范围。

这可以防止一个变量产生太大的影响，特别是当它以不同的单位测量时（即，如果一个变量以英寸为单位，另一个以码为单位）。

另请注意，我们此处使用的标准化方法只是一种可能的选择。

在某些情况下，将变量归一化在 0 到 1 之间，甚至在 0 到 100 之间是有意义的。

以下教程解释了如何执行其他类型的标准化：

大家好，我是本杰明，一位退休的统计学教授，后来成为 Statorials 的热心教师。凭借在统计领域的丰富经验和专业知识，我渴望分享我的知识，通过 Statorials 增强学生的能力。了解更多