Z 점수 정규화: 정의 및 예


Z-score 정규화란 데이터 세트의 각 값을 모든 값의 평균이 0, 표준편차가 1이 되도록 정규화하는 과정을 말합니다.

다음 공식을 사용하여 데이터세트의 각 값에 대해 z-점수 정규화를 수행합니다.

새 값 = (x – μ) / σ

금:

  • x : 원래 값
  • μ : 데이터의 평균
  • σ : 데이터의 표준편차

다음 예에서는 실제로 데이터세트에 대해 z-점수 정규화를 수행하는 방법을 보여줍니다.

예: Z-점수 정규화 수행

다음과 같은 데이터 세트가 있다고 가정합니다.

계산기를 사용하면 데이터 세트의 평균이 21.2 이고 표준 편차가 29.8 임을 알 수 있습니다.

데이터 세트의 첫 번째 값에 대한 z-점수 정규화를 수행하려면 다음 공식을 사용할 수 있습니다.

  • 새 값 = (x – μ) / σ
  • 새 값 = (3 – 21.2) / 29.8
  • 새 값 = -0.61

이 공식을 사용하여 데이터세트의 각 값에 대해 z-점수 정규화를 수행할 수 있습니다.

정규화된 값의 평균은 0 이고 정규화된 값의 표준편차는 1 입니다.

정규화된 값은 원래 값과 평균 사이의 표준 편차 수를 나타냅니다.

예를 들어:

  • 데이터세트의 첫 번째 값은 평균보다 0.61 표준편차 낮습니다.
  • 데이터세트의 두 번째 값은 평균보다 0.54 표준편차 낮습니다.
  • 데이터세트의 마지막 값은 평균보다 3.79 표준편차 높습니다.

이러한 유형의 정규화를 수행하면 데이터 세트(134)의 명백한 이상치가 더 이상 대규모 이상치가 아닌 방식으로 변환된다는 이점이 있습니다.

그런 다음 이 데이터 세트를 사용하여 일부 유형의 기계 학습 모델을 맞추면 이상치는 더 이상 모델 적합에 미칠 수 있는 만큼 많은 영향을 미치지 않습니다.

추가 리소스

다음 튜토리얼에서는 다양한 정규화 기술에 대한 추가 정보를 제공합니다.

표준화 또는 정규화: 차이점은 무엇입니까?
0과 1 사이의 데이터를 정규화하는 방법
0에서 100 사이의 데이터를 정규화하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다