0과 1 사이의 데이터를 정규화하는 방법
0과 1 사이의 데이터 세트 값을 정규화하려면 다음 공식을 사용할 수 있습니다.
z i = (x i – 최소(x)) / (최대(x) – 최소(x))
금:
- z i : 데이터 세트의 i번째 정규화된 값
- x i : 데이터세트의 i번째 값
- min(x) : 데이터 세트의 최소값
- max(x): 데이터세트의 최대값
예를 들어 다음과 같은 데이터 세트가 있다고 가정해 보겠습니다.

데이터 세트의 최소값은 13이고 최대값은 71입니다.
13 의 첫 번째 값을 정규화하기 위해 이전에 공유한 공식을 적용합니다.
- z i = (x i – 최소(x)) / (최대(x) – 최소(x)) = (13 – 13) / (71 – 13) = 0
16 의 두 번째 값을 정규화하기 위해 동일한 공식을 사용합니다.
- z i = (x i – 최소(x)) / (최대(x) – 최소(x)) = (16 – 13) / (71 – 13) = 0.0517
19 의 세 번째 값을 정규화하기 위해 동일한 공식을 사용합니다.
- z i = (x i – 최소(x)) / (최대(x) – 최소(x)) = (19 – 13) / (71 – 13) = 0.1034
이와 똑같은 공식을 사용하여 원본 데이터 세트의 각 값을 0과 1 사이로 정규화할 수 있습니다.

이 정규화 방법을 사용하면 다음 설명이 항상 true가 됩니다.
- 데이터 세트의 최소값에 대한 정규화된 값은 항상 0입니다.
- 데이터세트의 최대값에 대한 정규화된 값은 항상 1입니다.
- 데이터 세트의 다른 모든 값에 대한 정규화된 값은 0과 1 사이입니다.
데이터를 정규화해야 하는 경우
종종 우리는 다양한 척도에서 측정된 여러 변수를 갖고 각 변수가 동일한 범위를 갖기를 원하는 일부 유형의 분석을 수행할 때 변수를 표준화합니다.
이는 특히 다른 단위로 측정되는 경우(즉, 한 변수는 인치로 측정되고 다른 변수는 야드로 측정되는 경우) 하나의 변수가 과도한 영향을 미치는 것을 방지합니다.
또한 이 튜토리얼에서는 데이터 값을 정규화하기 위해 최소-최대 정규화 라는 방법을 사용했다는 점도 주목할 가치가 있습니다.
가장 일반적인 두 가지 정규화 방법은 다음과 같습니다.
1. 최소-최대 정규화
- 목적: 각 데이터 값을 0에서 100 사이의 값으로 변환합니다.
- 공식: 새 값 = (값 – 최소) / (최대 – 최소) * 100
2. 평균 정규화
- 목적: 모든 값의 평균이 0과 std가 되도록 값을 조정합니다. 개발자 1입니다.
- 공식: 새 값 = (값 – 평균) / (표준 편차)
추가 리소스
다음 튜토리얼에서는 다양한 통계 소프트웨어를 사용하여 데이터를 정규화하는 방법을 설명합니다.
Excel에서 데이터를 정규화하는 방법
R에서 데이터를 정규화하는 방법
Python에서 열을 정규화하는 방법