-1과 1 사이의 데이터를 정규화하는 방법
-1과 1 사이의 데이터 세트 값을 정규화하려면 다음 공식을 사용할 수 있습니다.
z i = 2 * ((x i – x min ) / (x max – x min )) – 1
금:
- z i : 데이터 세트의 i번째 정규화된 값
- x i : 데이터세트의 i번째 값
- x min : 데이터 세트의 최소값
- x max : 데이터세트의 최대값
예를 들어 다음과 같은 데이터 세트가 있다고 가정해 보겠습니다.

데이터 세트의 최소값은 13이고 최대값은 71입니다.
13 의 첫 번째 값을 정규화하기 위해 이전에 공유한 공식을 적용합니다.
- z i = 2 * ((x i – x 최소 ) / (x 최대 – x 최소 )) – 1 = 2 * ((13 – 13) / (71 – 13)) – 1 = -1
16 의 두 번째 값을 정규화하기 위해 동일한 공식을 사용합니다.
- z i = 2 * ((x i – x 최소 ) / (x 최대 – x 최소 )) – 1 = 2 * ((16 – 13) / (71 – 13)) – 1 = -0.897
19 의 세 번째 값을 정규화하기 위해 동일한 공식을 사용합니다.
- z i = 2 * ((x i – x 최소 ) / (x 최대 – x 최소 )) – 1 = 2 * ((19 – 13) / (71 – 13)) – 1 = -0.793
이와 똑같은 공식을 사용하여 원본 데이터세트의 각 값을 -1과 1 사이로 정규화할 수 있습니다.

정규화된 데이터세트의 각 값은 이제 -1과 1 사이입니다.
이 정규화 방법을 사용하면 다음 설명이 항상 true가 됩니다.
- 데이터 세트의 최소값에 대한 정규화된 값은 항상 -1입니다.
- 데이터세트의 최대값에 대한 정규화된 값은 항상 1입니다.
- 데이터세트의 다른 모든 값에 대한 정규화된 값은 -1과 1 사이입니다.
데이터를 정규화해야 하는 경우
종종 우리는 다양한 척도에서 측정된 여러 변수를 갖고 각 변수가 동일한 범위를 갖기를 원하는 일부 유형의 분석을 수행할 때 변수를 표준화합니다.
이렇게 하면 특히 변수가 다른 단위로 측정되는 경우(즉, 한 변수는 인치로 측정되고 다른 변수는 야드로 측정되는 경우) 하나의 변수가 너무 많은 영향을 받는 것을 방지할 수 있습니다.
또한 여기서 사용한 정규화 방법은 가능한 옵션 중 하나일 뿐입니다.
어떤 경우에는 0과 1 사이, 심지어 0과 100 사이의 변수를 정규화하는 것이 합리적입니다.
추가 리소스
다음 튜토리얼에서는 다른 유형의 정규화를 수행하는 방법을 설명합니다.