Нормалізація z-оцінки: визначення та приклади
Нормалізація Z-показника відноситься до процесу нормалізації кожного значення в наборі даних таким чином, щоб середнє значення всіх значень дорівнювало 0, а стандартне відхилення дорівнювало 1.
Ми використовуємо наступну формулу для нормалізації z-показника для кожного значення в наборі даних:
Нове значення = (x – μ) / σ
золото:
- x : вихідне значення
- μ : Середнє значення даних
- σ : стандартне відхилення даних
У наступному прикладі показано, як на практиці виконати нормалізацію z-показника для набору даних.
Приклад: нормалізація Z-показника
Припустимо, ми маємо наступний набір даних:
Використовуючи калькулятор, ми можемо побачити, що середнє значення набору даних становить 21,2 , а стандартне відхилення – 29,8 .
Щоб виконати нормалізацію z-показника до першого значення в наборі даних, ми можемо використати таку формулу:
- Нове значення = (x – μ) / σ
- Нове значення = (3 – 21,2) / 29,8
- Нове значення = -0,61
Ми можемо використовувати цю формулу для нормалізації z-показника для кожного значення в наборі даних:
Середнє значення нормалізованих значень дорівнює 0 , а стандартне відхилення нормалізованих значень дорівнює 1 .
Нормовані значення представляють собою кількість стандартних відхилень між вихідним значенням і середнім.
Наприклад:
- Перше значення в наборі даних на 0,61 стандартного відхилення нижче середнього.
- Друге значення в наборі даних на 0,54 стандартних відхилень нижче середнього.
- …
- Останнє значення в наборі даних становить 3,79 стандартних відхилень вище середнього.
Перевага виконання цього типу нормалізації полягає в тому, що очевидний викид у наборі даних (134) було перетворено таким чином, що він більше не є масивним викидом.
Якщо ми потім використаємо цей набір даних для підгонки певного типу моделі машинного навчання , викид більше не матиме такого сильного впливу, як міг би мати на підгонку моделі.
Додаткові ресурси
Наступні посібники надають додаткову інформацію про різні методи нормалізації:
Стандартизація чи нормалізація: в чому різниця?
Як нормалізувати дані між 0 і 1
Як нормалізувати дані від 0 до 100