Преобразование бокса-кокса в excel (шаг за шагом)
Преобразование Бокса-Кокса — это широко используемый метод преобразования набора данных с ненормальным распределением в набор с более нормальным распределением .
Основная идея состоит в том, чтобы найти такое значение λ, чтобы преобразованные данные были как можно ближе к нормальному распределению, используя следующую формулу:
- y(λ) = (y λ – 1) / λ, если y ≠ 0
- y(λ) = log(y), если y = 0
В следующем пошаговом примере показано, как выполнить преобразование Бокса-Кокса для набора данных в Excel.
Шаг 1: Введите данные
Начнем с ввода значений из набора данных:
Шаг 2. Отсортируйте данные.
Затем создайте столбец индекса и столбец отсортированных данных:
Шаг 3. Выберите произвольное значение для Lambda.
Далее мы выберем произвольное значение 1 для лямбды и применим к данным временное преобразование Box-Cox:
Шаг 4: Рассчитайте Z-показатели
Далее мы рассчитаем z-показатель для каждого значения индекса:
Затем мы рассчитаем корреляцию между значениями, преобразованными Box-Cox, и z-показателями:
Шаг 5. Найдите оптимальное значение лямбды
Далее мы воспользуемся поиском цели, чтобы найти оптимальное значение лямбды для использования в преобразовании box-cox.
Для этого нажмите вкладку «Данные» на верхней ленте. Затем нажмите «Анализ «что, если»» в группе «Прогнозы» .
В раскрывающемся меню нажмите «Поиск цели» и введите следующие значения:
Как только вы нажмете «ОК» , Goal Seek автоматически найдет оптимальное значение лямбды, равное -0,5225 .
Шаг 6. Выполните преобразование Бокса-Кокса
Наконец, мы применим преобразование box-cox к исходным данным, используя значение лямбда -0,5225:
Бонус: мы можем подтвердить, что преобразованные данные нормально распределяются, выполнив тест Жарка-Бера в Excel .
Дополнительные ресурсы
Как преобразовать данные в Excel (журнал, квадратный корень, кубический корень)
Как рассчитать Z-баллы в Excel