Як winsorize дані в excel


Winsorizing даних означає встановлення крайніх викидів, що дорівнюють заданому процентилю даних.

Наприклад, 90% winsorization встановлює всі спостереження вище 95-го процентиля рівними значенню 95-го процентиля, а всі спостереження нижче 5-го процентиля дорівнює значенню 5-го процентиля.

Цей підручник містить покроковий приклад того, як winsorize набір даних у Excel.

Крок 1: Створіть дані

Спочатку ми створимо такий набір даних:

Крок 2: обчисліть верхній і нижній процентиль

Для цього прикладу ми виконаємо 90% winsorization. Це означає, що ми встановимо всі значення вище 95-го процентиля рівними 95-му процентилю, а всі значення нижче 5-го процентиля дорівнюють 5-му процентилю.

Наступні формули показують, як знайти 5-й і 95-й процентиль:

Приклад winsorization даних в Excel

5-й процентиль виявляється 12,35 , а 95-й процентиль виявляється 92,05 .

Крок 3: Winsorize дані

Нарешті, ми використаємо наступну формулу для виграшу даних:

Winsorize дані в Excel

Зауважте, що ми просто копіюємо та вставляємо формулу з клітинки F2 в решту клітинок у стовпці F.

У цьому випадку значення 3 стало 12,35 , а значення 98 стало 92,05 .

Зверніть увагу, що в цьому прикладі ми виконали 90% winsorization, але можна також виконати 80% winsorization, 95% winsorization, 99% winsorization тощо. простим обчисленням різних верхніх і нижніх процентилів.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *