如何标准化 0 到 1 之间的数据
要将数据集中的值标准化为 0 到 1 之间,可以使用以下公式:
z i = (x i – 最小值(x)) / (最大值(x) – 最小值(x))
金子:
- z i :数据集中的第 i 个归一化值
- x i :数据集的第 i 个值
- min(x) :数据集中的最小值
- max(x):数据集中的最大值
例如,假设我们有以下数据集:
数据集中的最小值为 13,最大值为 71。
为了标准化13的第一个值,我们将应用之前共享的公式:
- z i = ( xi – 最小值(x)) / (最大值(x) – 最小值(x)) = (13 – 13) / (71 – 13) = 0
为了标准化16的第二个值,我们将使用相同的公式:
- z i = ( xi – 最小值(x)) / (最大值(x) – 最小值(x)) = (16 – 13) / (71 – 13) = 0.0517
为了标准化第三个值19 ,我们将使用相同的公式:
- z i = ( xi – 最小值(x)) / (最大值(x) – 最小值(x)) = (19 – 13) / (71 – 13) = 0.1034
我们可以使用这个完全相同的公式将原始数据集中的每个值标准化为 0 到 1 之间:
使用这种标准化方法,以下陈述将始终为真:
- 数据集中最小值的标准化值始终为 0。
- 数据集中最大值的归一化值始终为 1。
- 数据集中所有其他值的归一化值将介于 0 和 1 之间。
何时标准化数据
当我们进行某种类型的分析时,我们通常会标准化变量,在这种分析中,我们有多个在不同尺度上测量的变量,并且我们希望每个变量具有相同的范围。
这可以防止一个变量产生不适当的影响,特别是当它以不同的单位测量时(即,如果一个变量以英寸为单位,另一个以码为单位)。
还值得注意的是,我们在本教程中使用了一种称为最小-最大标准化的方法来标准化数据值。
两种最常见的标准化方法是:
1.最小-最大归一化
- 用途:将每个数据值转换为 0 到 100 之间的值。
- 公式:新值 = (值 – 最小值) / (最大值 – 最小值) * 100
2. 平均归一化
- 目的:缩放值,使所有值的平均值为 0 和 std。开发人员。是 1。
- 公式:新值=(值-平均值)/(标准差)
其他资源
以下教程解释了如何使用不同的统计软件对数据进行标准化: