Как нормализовать данные от 0 до 100


Чтобы нормализовать значения в наборе данных от 0 до 100, вы можете использовать следующую формулу:

z i = (x i – min(x)) / (max(x) – min(x)) * 100

Золото:

  • z i : i-е нормализованное значение в наборе данных
  • x i : i-е значение набора данных
  • min(x) : минимальное значение в наборе данных.
  • max(x): максимальное значение в наборе данных.

Например, предположим, что у нас есть следующий набор данных:

Минимальное значение в наборе данных — 12, а максимальное — 68.

Чтобы нормализовать первое значение 12 , мы применим ранее использованную формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (12 – 12) / (68 – 12) * 100 = 0

Чтобы нормализовать второе значение 19 , мы бы использовали ту же формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (19 – 12) / (68 – 12) * 100 = 12,5

Чтобы нормализовать третье значение 21 , мы будем использовать ту же формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 100 = (21 – 12) / (68 – 12) * 100 = 16,07

Мы можем использовать ту же самую формулу для нормализации каждого значения в исходном наборе данных от 0 до 100:

Нормализовать данные от 0 до 100

Как нормализовать данные между любым диапазоном

Фактически мы можем использовать эту формулу для нормализации набора данных от 0 до любого числа:

z i = (x i – min(x)) / (max(x) – min(x)) * Q

где Q — максимальное число, необходимое для нормализованных значений данных.

В предыдущем примере мы выбрали Q равным 100, но мы могли бы легко нормализовать диапазон значений данных от 0 до 1000, выбрав Q равным 1000:

Чтобы нормализовать первое значение 12 , мы применим формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (12 – 12) / (68 – 12) * 100 = 0

Чтобы нормализовать второе значение 19 , мы бы использовали ту же формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (19 – 12) / (68 – 12) * 100 = 125

Чтобы нормализовать третье значение 21 , мы будем использовать ту же формулу:

  • z i = (x i – min(x)) / (max(x) – min(x)) * 1000 = (21 – 12) / (68 – 12) * 100 = 160,7

Мы можем использовать ту же самую формулу для нормализации каждого значения в исходном наборе данных от 0 до 1000:

Нормализовать данные между двумя числами

Когда нормализовать данные

Иногда мы стандартизируем переменные, когда проводим определенный тип анализа, в котором у нас есть несколько переменных, измеренных в разных масштабах, и мы хотим, чтобы каждая из переменных имела один и тот же диапазон.

Это предотвращает неправомерное влияние одной переменной, особенно если она измеряется в разных единицах измерения (т. е. если одна переменная измеряется в дюймах, а другая в ярдах).

Также стоит отметить, что в этом уроке мы использовали метод, известный как нормализация min-max, для нормализации значений данных.

Два наиболее распространенных метода нормализации:

1. Нормализация Min-Max

  • Цель: Преобразует каждое значение данных в значение от 0 до 100.
  • Формула: Новое значение = (значение – мин) / (макс – мин) * 100

2. Средняя нормализация

  • Цель: Масштабирует значения таким образом, чтобы среднее значение всех значений было равно 0 и стандартному. разработчик это 1.
  • Формула: Новое значение = (значение – среднее) / (стандартное отклонение)

Дополнительные ресурсы

Как нормализовать данные между 0 и 1
Как нормализовать данные в Excel
Как нормализовать данные в R
Как нормализовать столбцы в Python

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *