0에서 100 사이의 데이터를 정규화하는 방법
0에서 100 사이의 데이터 세트 값을 정규화하려면 다음 공식을 사용할 수 있습니다.
z i = (x i – 최소(x)) / (최대(x) – 최소(x)) * 100
금:
- z i : 데이터 세트의 i번째 정규화된 값
- x i : 데이터세트의 i번째 값
- min(x) : 데이터 세트의 최소값
- max(x): 데이터세트의 최대값
예를 들어 다음과 같은 데이터 세트가 있다고 가정해 보겠습니다.

데이터 세트의 최소값은 12이고 최대값은 68입니다.
12 의 첫 번째 값을 정규화하기 위해 이전에 공유한 공식을 적용합니다.
- z i = (x i – 최소(x)) / (최대(x) – 최소(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0
19 의 두 번째 값을 정규화하기 위해 동일한 공식을 사용합니다.
- z i = (x i – 최소(x)) / (최대(x) – 최소(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12.5
21 의 세 번째 값을 정규화하기 위해 동일한 공식을 사용합니다.
- z i = (x i – 최소(x)) / (최대(x) – 최소(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16.07
이와 똑같은 공식을 사용하여 원본 데이터세트의 각 값을 0에서 100 사이로 정규화할 수 있습니다.

모든 범위에서 데이터를 정규화하는 방법
실제로 이 공식을 사용하여 0과 임의의 숫자 사이의 데이터 세트를 정규화할 수 있습니다.
z i = (x i – 최소(x)) / (최대(x) – 최소(x)) * Q
여기서 Q는 정규화된 데이터 값에 대해 원하는 최대 수입니다.
이전 예에서는 Q를 100으로 선택했지만 Q를 1000으로 선택하면 0과 1000 사이의 데이터 값 범위를 쉽게 정규화할 수 있습니다.
12 의 첫 번째 값을 정규화하기 위해 다음 공식을 적용합니다.
- z i = (x i – 최소(x)) / (최대(x) – 최소(x)) * 1000 = (12 – 12) / (68 – 12) * 100 = 0
19 의 두 번째 값을 정규화하기 위해 동일한 공식을 사용합니다.
- z i = (x i – 최소(x)) / (최대(x) – 최소(x)) * 1000 = (19 – 12) / (68 – 12) * 100 = 125
21 의 세 번째 값을 정규화하기 위해 동일한 공식을 사용합니다.
- z i = (x i – 최소(x)) / (최대(x) – 최소(x)) * 1,000 = (21 – 12) / (68 – 12) * 100 = 160.7
이와 똑같은 공식을 사용하여 원본 데이터세트의 각 값을 0에서 1000 사이로 정규화할 수 있습니다.

데이터를 정규화해야 하는 경우
때로는 서로 다른 규모로 측정된 여러 변수가 있고 각 변수가 동일한 범위를 갖기를 원하는 특정 유형의 분석을 수행할 때 변수를 표준화합니다.
이는 특히 다른 단위로 측정되는 경우(즉, 한 변수는 인치로 측정되고 다른 변수는 야드로 측정되는 경우) 하나의 변수가 과도한 영향을 미치는 것을 방지합니다.
또한 이 튜토리얼에서는 데이터 값을 정규화하기 위해 최소-최대 정규화 라는 방법을 사용했다는 점도 주목할 가치가 있습니다.
가장 일반적인 두 가지 정규화 방법은 다음과 같습니다.
1. 최소-최대 정규화
- 목적: 각 데이터 값을 0에서 100 사이의 값으로 변환합니다.
- 공식: 새 값 = (값 – 최소) / (최대 – 최소) * 100
2. 평균 정규화
- 목적: 모든 값의 평균이 0과 std가 되도록 값을 조정합니다. 개발자 1입니다.
- 공식: 새 값 = (값 – 평균) / (표준 편차)
추가 리소스
0과 1 사이의 데이터를 정규화하는 방법
Excel에서 데이터를 정규화하는 방법
R에서 데이터를 정규화하는 방법
Python에서 열을 정규화하는 방법