-1과 1 사이의 데이터를 정규화하는 방법


-1과 1 사이의 데이터 세트 값을 정규화하려면 다음 공식을 사용할 수 있습니다.

z i = 2 * ((x i – x min ) / (x max – x min )) – 1

금:

  • z i : 데이터 세트의 i번째 정규화된 값
  • x i : 데이터세트의 i번째
  • x min : 데이터 세트의 최소값
  • x max : 데이터세트의 최대값

예를 들어 다음과 같은 데이터 세트가 있다고 가정해 보겠습니다.

데이터 세트의 최소값은 13이고 최대값은 71입니다.

13 의 첫 번째 값을 정규화하기 위해 이전에 공유한 공식을 적용합니다.

  • z i = 2 * ((x i – x 최소 ) / (x 최대 – x 최소 )) – 1 = 2 * ((13 – 13) / (71 – 13)) – 1 = -1

16 의 두 번째 값을 정규화하기 위해 동일한 공식을 사용합니다.

  • z i = 2 * ((x i – x 최소 ) / (x 최대 – x 최소 )) – 1 = 2 * ((16 – 13) / (71 – 13)) – 1 = -0.897

19 의 세 번째 값을 정규화하기 위해 동일한 공식을 사용합니다.

  • z i = 2 * ((x i – x 최소 ) / (x 최대 – x 최소 )) – 1 = 2 * ((19 – 13) / (71 – 13)) – 1 = -0.793

이와 똑같은 공식을 사용하여 원본 데이터세트의 각 값을 -1과 1 사이로 정규화할 수 있습니다.

정규화된 데이터세트의 각 값은 이제 -1과 1 사이입니다.

이 정규화 방법을 사용하면 다음 설명이 항상 true가 됩니다.

  • 데이터 세트의 최소값에 대한 정규화된 값은 항상 -1입니다.
  • 데이터세트의 최대값에 대한 정규화된 값은 항상 1입니다.
  • 데이터세트의 다른 모든 값에 대한 정규화된 값은 -1과 1 사이입니다.

데이터를 정규화해야 하는 경우

종종 우리는 다양한 척도에서 측정된 여러 변수를 갖고 각 변수가 동일한 범위를 갖기를 원하는 일부 유형의 분석을 수행할 때 변수를 표준화합니다.

이렇게 하면 특히 변수가 다른 단위로 측정되는 경우(즉, 한 변수는 인치로 측정되고 다른 변수는 야드로 측정되는 경우) 하나의 변수가 너무 많은 영향을 받는 것을 방지할 수 있습니다.

또한 여기서 사용한 정규화 방법은 가능한 옵션 중 하나일 뿐입니다.

어떤 경우에는 0과 1 사이, 심지어 0과 100 사이의 변수를 정규화하는 것이 합리적입니다.

추가 리소스

다음 튜토리얼에서는 다른 유형의 정규화를 수행하는 방법을 설명합니다.

0과 1 사이의 데이터를 정규화하는 방법
0에서 100 사이의 데이터를 정규화하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다