Как преобразовать данные в excel (журнал, квадратный корень, кубический корень)
Многие статистические тесты предполагают, что наборы данных распределены нормально .
Однако на практике это предположение часто нарушается. Один из способов решения этой проблемы — преобразовать значения в наборе данных с помощью одного из следующих трех преобразований:
1. Преобразование журнала: преобразуйте значения y в log(y) .
2. Преобразование квадратного корня: преобразуйте значения y в √y .
3. Преобразование корня куба: преобразуйте значения y в y 1/3 .
Выполняя эти преобразования, данные обычно приближаются к нормальному распределению. В следующих примерах показано, как выполнить эти преобразования в Excel.
Преобразование журнала в Excel
Чтобы применить преобразование журнала к набору данных в Excel, мы можем использовать функцию =LOG10() .
На следующем снимке экрана показано, как применить преобразование журнала к набору данных в Excel:
Чтобы определить, сделало ли это преобразование набор данных более нормально распределенным, мы можем выполнить тест на нормальность Жарка-Бера в Excel .
Статистика теста для этого теста определяется как:
JB =(n/6) * ( S2 + ( C2 /4))
Золото:
- n: количество наблюдений в выборке
- S: асимметрия образца
- C: лестный образец
При нулевой гипотезе нормальности JB ~ X 2 (2).
Если значение p , соответствующее тестовой статистике, ниже определенного уровня значимости (например, α = 0,05), то мы можем отвергнуть нулевую гипотезу и сделать вывод, что данные не распределяются нормально.
На следующем снимке экрана показано, как выполнить тест Жарка-Бера для необработанных и преобразованных данных:
Обратите внимание, что значение p необработанных данных меньше 0,05, что указывает на то, что они не распределяются нормально.
Однако значение p преобразованных данных не меньше 0,05, поэтому можно предположить, что они нормально распределены. Это говорит нам о том, что преобразование журнала сработало.
Преобразование квадратного корня в Excel
Чтобы применить преобразование квадратного корня к набору данных в Excel, мы можем использовать функцию =SQRT() .
На следующем снимке экрана показано, как применить преобразование квадратного корня к набору данных в Excel:
Обратите внимание, что значение p теста нормальности Жара-Бера для преобразованных данных составляет не менее 0,05, что указывает на то, что преобразование квадратного корня было эффективным.
Преобразование корня куба в Excel
Чтобы применить преобразование корня куба к набору данных в Excel, мы можем использовать функцию =DATA^(1/3) .
На следующем снимке экрана показано, как применить преобразование кубического корня к набору данных в Excel:
Значение p теста нормальности Жара-Бера для преобразованных данных составляет не менее 0,05, что указывает на то, что преобразование кубического корня было эффективным.
Три преобразования данных эффективно сделали необработанные данные более нормальными.
Из трех преобразований логарифмическое преобразование дало наибольшее значение p в тесте нормальности Жарка-Бера, что говорит нам о том, что оно, вероятно, сделало данные «наиболее» нормально распределенными данными среди трех методов преобразования.
Дополнительные ресурсы
Как выполнить преобразование Бокса-Кокса в Excel
Что такое предположение нормальности в статистике?