0과 1 사이의 데이터를 정규화하는 방법


0과 1 사이의 데이터 세트 값을 정규화하려면 다음 공식을 사용할 수 있습니다.

z i = (x i – 최소(x)) / (최대(x) – 최소(x))

금:

  • z i : 데이터 세트의 i번째 정규화된 값
  • x i : 데이터세트의 i번째
  • min(x) : 데이터 세트의 최소값
  • max(x): 데이터세트의 최대값

예를 들어 다음과 같은 데이터 세트가 있다고 가정해 보겠습니다.

데이터 세트의 최소값은 13이고 최대값은 71입니다.

13 의 첫 번째 값을 정규화하기 위해 이전에 공유한 공식을 적용합니다.

  • z i = (x i – 최소(x)) / (최대(x) – 최소(x)) = (13 – 13) / (71 – 13) = 0

16 의 두 번째 값을 정규화하기 위해 동일한 공식을 사용합니다.

  • z i = (x i – 최소(x)) / (최대(x) – 최소(x)) = (16 – 13) / (71 – 13) = 0.0517

19 의 세 번째 값을 정규화하기 위해 동일한 공식을 사용합니다.

  • z i = (x i – 최소(x)) / (최대(x) – 최소(x)) = (19 – 13) / (71 – 13) = 0.1034

이와 똑같은 공식을 사용하여 원본 데이터 세트의 각 값을 0과 1 사이로 정규화할 수 있습니다.

0과 1 사이의 데이터 정규화

이 정규화 방법을 사용하면 다음 설명이 항상 true가 됩니다.

  • 데이터 세트의 최소값에 대한 정규화된 값은 항상 0입니다.
  • 데이터세트의 최대값에 대한 정규화된 값은 항상 1입니다.
  • 데이터 세트의 다른 모든 값에 대한 정규화된 값은 0과 1 사이입니다.

데이터를 정규화해야 하는 경우

종종 우리는 다양한 척도에서 측정된 여러 변수를 갖고 각 변수가 동일한 범위를 갖기를 원하는 일부 유형의 분석을 수행할 때 변수를 표준화합니다.

이는 특히 다른 단위로 측정되는 경우(즉, 한 변수는 인치로 측정되고 다른 변수는 야드로 측정되는 경우) 하나의 변수가 과도한 영향을 미치는 것을 방지합니다.

또한 이 튜토리얼에서는 데이터 값을 정규화하기 위해 최소-최대 정규화 라는 방법을 사용했다는 점도 주목할 가치가 있습니다.

가장 일반적인 두 가지 정규화 방법은 다음과 같습니다.

1. 최소-최대 정규화

  • 목적: 각 데이터 값을 0에서 100 사이의 값으로 변환합니다.
  • 공식: 새 값 = (값 – 최소) / (최대 – 최소) * 100

2. 평균 정규화

  • 목적: 모든 값의 평균이 0과 std가 되도록 값을 조정합니다. 개발자 1입니다.
  • 공식: 새 값 = (값 – 평균) / (표준 편차)

추가 리소스

다음 튜토리얼에서는 다양한 통계 소프트웨어를 사용하여 데이터를 정규화하는 방법을 설명합니다.

Excel에서 데이터를 정규화하는 방법
R에서 데이터를 정규화하는 방법
Python에서 열을 정규화하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다