Как нормализовать данные в google sheets


Нормализация набора значений данных означает масштабирование значений таким образом, чтобы среднее значение всех значений было равно 0, а стандартное отклонение равно 1.

В этом руководстве объясняется, как нормализовать данные в Google Sheets.

Пример: как нормализовать данные в Google Sheets

Допустим, у нас есть следующий набор данных в Google Sheets:

Используйте следующие шаги, чтобы нормализовать этот набор значений данных.

Шаг 1: Рассчитайте среднее значение.

Сначала мы будем использовать функцию = СРЗНАЧ (диапазон значений) , чтобы найти среднее значение набора данных.

Шаг 2: Найдите стандартное отклонение.

Далее мы будем использовать функцию =STDEV (диапазон значений) , чтобы найти стандартное отклонение набора данных.

Шаг 3: Нормализуйте значения.

Наконец, мы будем использовать функцию STANDARDIZE(x, Mean,standard_dev) для нормализации каждого значения в наборе данных.

ПРИМЕЧАНИЕ:

Функция СТАНДАРТИЗАЦИЯ использует следующую формулу для нормализации заданного значения данных:

Нормализованное значение = (x – x )/s

Золото:

  • х = значение данных
  • x = среднее значение набора данных
  • s = стандартное отклонение набора данных

На следующем изображении показана формула, используемая для нормализации первого значения в наборе данных:

Нормализованные данные в Google Sheets

После того как мы нормализовали первое значение в ячейке B2, мы можем навести указатель мыши на правый нижний угол ячейки B2, пока не появится маленький + . Дважды щелкните + , чтобы скопировать формулу в оставшиеся ячейки:

Нормализованный набор данных в Google Sheets

Теперь каждое значение в наборе данных нормализовано.

Как интерпретировать нормализованные данные

Формула, которую мы использовали для нормализации заданного значения данных x, выглядела так:

Нормализованное значение = (x – x )/s

Золото:

  • х = значение данных
  • x = среднее значение набора данных
  • s = стандартное отклонение набора данных

Если конкретная точка данных имеет нормализованное значение больше 0, это означает, что точка данных выше среднего. И наоборот, нормализованное значение меньше 0 указывает на то, что точка данных ниже среднего.

В частности, нормализованное значение говорит нам, на сколько стандартных отклонений исходная точка данных отличается от среднего значения. Например, рассмотрим точку данных «12» в нашем исходном наборе данных:

Нормализованный набор данных в Google Sheets

Нормализованное значение для «12» оказалось -1,288, рассчитанное следующим образом:

Нормализованное значение = (x – x )/s = (12 – 22,267)/7,968 = -1,288

Это говорит нам о том, что значение «12» на 1,288 стандартных отклонений ниже среднего значения исходного набора данных.

Каждое из нормализованных значений в наборе данных может помочь нам понять, насколько близко или далеко конкретное значение данных находится от среднего значения. Небольшое нормализованное значение указывает на то, что значение близко к среднему, тогда как большое нормализованное значение указывает на то, что значение далеко от среднего.

Дополнительные ресурсы

Как нормализовать данные в Excel
Как нормализовать данные в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *