如何标准化 -1 和 1 之间的数据
要将数据集中的值标准化在-1和1之间,可以使用以下公式:
z i = 2 * ((x i – x min ) / (x max – x min )) – 1
金子:
- z i :数据集中的第 i 个归一化值
- x i :数据集的第 i 个值
- x min :数据集中的最小值
- x max :数据集中的最大值
例如,假设我们有以下数据集:
数据集中的最小值为 13,最大值为 71。
为了标准化13的第一个值,我们将应用之前共享的公式:
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((13 – 13) / (71 – 13)) – 1 = -1
为了标准化16的第二个值,我们将使用相同的公式:
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((16 – 13) / (71 – 13)) – 1 = -0.897
为了标准化第三个值19 ,我们将使用相同的公式:
- z i = 2 * ((x i – x min ) / (x max – x min )) – 1 = 2 * ((19 – 13) / (71 – 13)) – 1 = -0.793
我们可以使用这个完全相同的公式将原始数据集中的每个值标准化在 -1 和 1 之间:
标准化数据集中的每个值现在都在 -1 和 1 之间。
使用这种标准化方法,以下陈述将始终为真:
- 数据集中最小值的标准化值始终为 -1。
- 数据集中最大值的归一化值始终为 1。
- 数据集中所有其他值的归一化值将介于 -1 和 1 之间。
何时标准化数据
当我们进行某种类型的分析时,我们通常会标准化变量,在这种分析中,我们有多个在不同尺度上测量的变量,并且我们希望每个变量具有相同的范围。
这可以防止一个变量产生太大的影响,特别是当它以不同的单位测量时(即,如果一个变量以英寸为单位,另一个以码为单位)。
另请注意,我们此处使用的标准化方法只是一种可能的选择。
在某些情况下,将变量归一化在 0 到 1 之间,甚至在 0 到 100 之间是有意义的。
其他资源
以下教程解释了如何执行其他类型的标准化: