Как винсоризировать данные в excel


Винсоризация данных означает установку крайних выбросов, равных указанному процентилю данных.

Например, 90%-ная винсоризация устанавливает все наблюдения выше 95-го процентиля равными значению 95-го процентиля, а все наблюдения ниже 5-го процентиля равны значению 5-го процентиля.

В этом руководстве представлен пошаговый пример того, как преобразовать набор данных в Excel.

Шаг 1. Создайте данные

Сначала мы создадим следующий набор данных:

Шаг 2. Рассчитайте верхний и нижний процентили.

В этом примере мы выполним винсоризацию на 90%. Это означает, что мы установим все значения выше 95-го процентиля равными 95-му процентилю, а все значения ниже 5-го процентиля равными 5-му процентилю.

Следующие формулы показывают, как найти 5-й и 95-й процентили:

Пример винсоризации данных в Excel

5-й процентиль оказывается равным 12,35 , а 95-й процентиль — 92,05 .

Шаг 3: Winsorize данные

Наконец, мы будем использовать следующую формулу для обработки данных:

Winsorize данных в Excel

Обратите внимание, что мы просто копируем и вставляем формулу из ячейки F2 в остальные ячейки столбца F.

В этом случае значение 3 стало 12,35 , а значение 98 стало 92,05 .

Обратите внимание, что в этом примере мы выполнили винсоризацию на 90%, но можно также выполнить винсоризацию на 80%, винсоризацию на 95%, винсоризацию на 99% и т. д. путем простого расчета различных верхних и нижних процентилей.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *