Як нормалізувати дані від 0 до 100


Щоб нормалізувати значення в наборі даних від 0 до 100, ви можете використовувати таку формулу:

z i = (x i – min(x)) / (max(x) – min(x)) * 100

золото:

  • z i : i-те нормалізоване значення в наборі даних
  • x i : i-те значення набору даних
  • min(x) : мінімальне значення в наборі даних
  • max(x): максимальне значення в наборі даних

Наприклад, припустимо, що ми маємо такий набір даних:

Мінімальне значення в наборі даних – 12, а максимальне – 68.

Щоб нормалізувати перше значення 12 , ми б застосували формулу, наведену раніше:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0

Щоб нормалізувати друге значення 19 , ми використаємо ту саму формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12,5

Щоб нормалізувати третє значення 21 , ми використаємо ту саму формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16,07

Ми можемо використати ту саму формулу, щоб нормалізувати кожне значення у вихідному наборі даних від 0 до 100:

Нормалізація даних від 0 до 100

Як нормалізувати дані між будь-якими діапазонами

Ми можемо використовувати цю формулу для нормалізації набору даних від 0 до будь-якого числа:

z i = (x i – min(x)) / (max(x) – min(x)) * Q

де Q — це максимальне число, бажане для ваших нормалізованих значень даних.

У попередньому прикладі ми вибрали Q рівним 100, але ми могли легко нормалізувати діапазон значень даних між 0 і 1000, вибравши Q рівним 1000:

Щоб нормалізувати перше значення 12 , ми б застосували формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (12 – 12) / (68 – 12) * 100 = 0

Щоб нормалізувати друге значення 19 , ми використаємо ту саму формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (19 – 12) / (68 – 12) * 100 = 125

Щоб нормалізувати третє значення 21 , ми використаємо ту саму формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (21 – 12) / (68 – 12) * 100 = 160,7

Ми можемо використати ту саму формулу, щоб нормалізувати кожне значення у вихідному наборі даних від 0 до 1000:

Нормалізація даних між двома числами

Коли нормалізувати дані

Іноді ми стандартизуємо змінні, коли робимо певний тип аналізу, у якому ми маємо кілька змінних, виміряних у різних масштабах, і ми хочемо, щоб кожна зі змінних мала однаковий діапазон.

Це запобігає надмірному впливу однієї змінної, особливо якщо вона вимірюється в різних одиницях (тобто якщо одна змінна вимірюється в дюймах, а інша – у ярдах).

Варто також зазначити, що в цьому підручнику для нормалізації значень даних ми використали метод, відомий як мінімально-максимальна нормалізація .

Два найпоширеніші методи нормалізації:

1. Нормування Min-Max

  • Призначення: перетворює кожне значення даних на значення від 0 до 100.
  • Формула: нове значення = (значення – min) / (max – min) * 100

2. Середнє нормування

  • Призначення: масштабує значення таким чином, щоб середнє значення всіх значень дорівнювало 0 і станд. розробник дорівнює 1.
  • Формула: нове значення = (значення – середнє) / (стандартне відхилення)

Додаткові ресурси

Як нормалізувати дані між 0 і 1
Як нормалізувати дані в Excel
Як нормалізувати дані в R
Як нормалізувати стовпці в Python

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *