Как винсоризировать данные в excel
Винсоризация данных означает установку крайних выбросов, равных указанному процентилю данных.
Например, 90%-ная винсоризация устанавливает все наблюдения выше 95-го процентиля равными значению 95-го процентиля, а все наблюдения ниже 5-го процентиля равны значению 5-го процентиля.
В этом руководстве представлен пошаговый пример того, как преобразовать набор данных в Excel.
Шаг 1. Создайте данные
Сначала мы создадим следующий набор данных:
Шаг 2. Рассчитайте верхний и нижний процентили.
В этом примере мы выполним винсоризацию на 90%. Это означает, что мы установим все значения выше 95-го процентиля равными 95-му процентилю, а все значения ниже 5-го процентиля равными 5-му процентилю.
Следующие формулы показывают, как найти 5-й и 95-й процентили:
5-й процентиль оказывается равным 12,35 , а 95-й процентиль — 92,05 .
Шаг 3: Winsorize данные
Наконец, мы будем использовать следующую формулу для обработки данных:
Обратите внимание, что мы просто копируем и вставляем формулу из ячейки F2 в остальные ячейки столбца F.
В этом случае значение 3 стало 12,35 , а значение 98 стало 92,05 .
Обратите внимание, что в этом примере мы выполнили винсоризацию на 90%, но можно также выполнить винсоризацию на 80%, винсоризацию на 95%, винсоризацию на 99% и т. д. путем простого расчета различных верхних и нижних процентилей.