Як winsorize дані в excel
Winsorizing даних означає встановлення крайніх викидів, що дорівнюють заданому процентилю даних.
Наприклад, 90% winsorization встановлює всі спостереження вище 95-го процентиля рівними значенню 95-го процентиля, а всі спостереження нижче 5-го процентиля дорівнює значенню 5-го процентиля.
Цей підручник містить покроковий приклад того, як winsorize набір даних у Excel.
Крок 1: Створіть дані
Спочатку ми створимо такий набір даних:
Крок 2: обчисліть верхній і нижній процентиль
Для цього прикладу ми виконаємо 90% winsorization. Це означає, що ми встановимо всі значення вище 95-го процентиля рівними 95-му процентилю, а всі значення нижче 5-го процентиля дорівнюють 5-му процентилю.
Наступні формули показують, як знайти 5-й і 95-й процентиль:
5-й процентиль виявляється 12,35 , а 95-й процентиль виявляється 92,05 .
Крок 3: Winsorize дані
Нарешті, ми використаємо наступну формулу для виграшу даних:
Зауважте, що ми просто копіюємо та вставляємо формулу з клітинки F2 в решту клітинок у стовпці F.
У цьому випадку значення 3 стало 12,35 , а значення 98 стало 92,05 .
Зверніть увагу, що в цьому прикладі ми виконали 90% winsorization, але можна також виконати 80% winsorization, 95% winsorization, 99% winsorization тощо. простим обчисленням різних верхніх і нижніх процентилів.