Як нормалізувати дані від 0 до 100
Щоб нормалізувати значення в наборі даних від 0 до 100, ви можете використовувати таку формулу:
z i = (x i – min(x)) / (max(x) – min(x)) * 100
золото:
- z i : i-те нормалізоване значення в наборі даних
- x i : i-те значення набору даних
- min(x) : мінімальне значення в наборі даних
- max(x): максимальне значення в наборі даних
Наприклад, припустимо, що ми маємо такий набір даних:
Мінімальне значення в наборі даних – 12, а максимальне – 68.
Щоб нормалізувати перше значення 12 , ми б застосували формулу, наведену раніше:
- z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0
Щоб нормалізувати друге значення 19 , ми використаємо ту саму формулу:
- z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12,5
Щоб нормалізувати третє значення 21 , ми використаємо ту саму формулу:
- z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16,07
Ми можемо використати ту саму формулу, щоб нормалізувати кожне значення у вихідному наборі даних від 0 до 100:
Як нормалізувати дані між будь-якими діапазонами
Ми можемо використовувати цю формулу для нормалізації набору даних від 0 до будь-якого числа:
z i = (x i – min(x)) / (max(x) – min(x)) * Q
де Q — це максимальне число, бажане для ваших нормалізованих значень даних.
У попередньому прикладі ми вибрали Q рівним 100, але ми могли легко нормалізувати діапазон значень даних між 0 і 1000, вибравши Q рівним 1000:
Щоб нормалізувати перше значення 12 , ми б застосували формулу:
- z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (12 – 12) / (68 – 12) * 100 = 0
Щоб нормалізувати друге значення 19 , ми використаємо ту саму формулу:
- z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (19 – 12) / (68 – 12) * 100 = 125
Щоб нормалізувати третє значення 21 , ми використаємо ту саму формулу:
- z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (21 – 12) / (68 – 12) * 100 = 160,7
Ми можемо використати ту саму формулу, щоб нормалізувати кожне значення у вихідному наборі даних від 0 до 1000:
Коли нормалізувати дані
Іноді ми стандартизуємо змінні, коли робимо певний тип аналізу, у якому ми маємо кілька змінних, виміряних у різних масштабах, і ми хочемо, щоб кожна зі змінних мала однаковий діапазон.
Це запобігає надмірному впливу однієї змінної, особливо якщо вона вимірюється в різних одиницях (тобто якщо одна змінна вимірюється в дюймах, а інша – у ярдах).
Варто також зазначити, що в цьому підручнику для нормалізації значень даних ми використали метод, відомий як мінімально-максимальна нормалізація .
Два найпоширеніші методи нормалізації:
1. Нормування Min-Max
- Призначення: перетворює кожне значення даних на значення від 0 до 100.
- Формула: нове значення = (значення – min) / (max – min) * 100
2. Середнє нормування
- Призначення: масштабує значення таким чином, щоб середнє значення всіх значень дорівнювало 0 і станд. розробник дорівнює 1.
- Формула: нове значення = (значення – середнє) / (стандартне відхилення)
Додаткові ресурси
Як нормалізувати дані між 0 і 1
Як нормалізувати дані в Excel
Як нормалізувати дані в R
Як нормалізувати стовпці в Python