Z 점수 정규화: 정의 및 예
Z-score 정규화란 데이터 세트의 각 값을 모든 값의 평균이 0, 표준편차가 1이 되도록 정규화하는 과정을 말합니다.
다음 공식을 사용하여 데이터세트의 각 값에 대해 z-점수 정규화를 수행합니다.
새 값 = (x – μ) / σ
금:
- x : 원래 값
- μ : 데이터의 평균
- σ : 데이터의 표준편차
다음 예에서는 실제로 데이터세트에 대해 z-점수 정규화를 수행하는 방법을 보여줍니다.
예: Z-점수 정규화 수행
다음과 같은 데이터 세트가 있다고 가정합니다.
계산기를 사용하면 데이터 세트의 평균이 21.2 이고 표준 편차가 29.8 임을 알 수 있습니다.
데이터 세트의 첫 번째 값에 대한 z-점수 정규화를 수행하려면 다음 공식을 사용할 수 있습니다.
- 새 값 = (x – μ) / σ
- 새 값 = (3 – 21.2) / 29.8
- 새 값 = -0.61
이 공식을 사용하여 데이터세트의 각 값에 대해 z-점수 정규화를 수행할 수 있습니다.
정규화된 값의 평균은 0 이고 정규화된 값의 표준편차는 1 입니다.
정규화된 값은 원래 값과 평균 사이의 표준 편차 수를 나타냅니다.
예를 들어:
- 데이터세트의 첫 번째 값은 평균보다 0.61 표준편차 낮습니다.
- 데이터세트의 두 번째 값은 평균보다 0.54 표준편차 낮습니다.
- …
- 데이터세트의 마지막 값은 평균보다 3.79 표준편차 높습니다.
이러한 유형의 정규화를 수행하면 데이터 세트(134)의 명백한 이상치가 더 이상 대규모 이상치가 아닌 방식으로 변환된다는 이점이 있습니다.
그런 다음 이 데이터 세트를 사용하여 일부 유형의 기계 학습 모델을 맞추면 이상치는 더 이상 모델 적합에 미칠 수 있는 만큼 많은 영향을 미치지 않습니다.
추가 리소스
다음 튜토리얼에서는 다양한 정규화 기술에 대한 추가 정보를 제공합니다.
표준화 또는 정규화: 차이점은 무엇입니까?
0과 1 사이의 데이터를 정규화하는 방법
0에서 100 사이의 데이터를 정규화하는 방법