Як виконати тест жарке-бера в r
Тест Жарке-Бера — це тест на відповідність, який визначає, чи демонструють вибіркові дані асимметрию та ексцес, які відповідають нормальному розподілу .
Статистика тесту Жарке-Бера завжди є додатним числом, і якщо воно далеке від нуля, це означає, що вибіркові дані не мають нормального розподілу.
Статистика тесту JB визначається як:
JB =[(n-k+1) / 6] * [S 2 + (0,25*(C-3) 2 )]
де n – кількість спостережень у вибірці, k – кількість регресорів (k = 1, якщо не використовується в контексті регресії), S – асиметрія вибірки, а C – ексцес вибірки.
За нульовою гіпотезою нормальності JB ~
Цей підручник пояснює, як виконати тест Жарке-Бера в R.
Тест Жарке-Бера в Р
Щоб виконати тест Жарке-Бера для прикладу набору даних, ми можемо використати пакет tseries :
#install (if not already installed) and load tseries package if(!require(tseries)){install.packages('tseries')} #generate a list of 100 normally distributed random variables dataset <- rnorm(100) #conduct Jarque-Bera test jarque.bera.test(dataset)
Це генерує такий результат:
Це говорить нам про те, що статистика тесту становить 0,67446, а значення p тесту — 0,7137. У цьому випадку ми не зможемо відхилити нульову гіпотезу про те, що дані розподілені нормально.
Цей результат не повинен дивувати, оскільки створений нами набір даних складається зі 100 випадкових змінних, які відповідають нормальному розподілу.
Натомість подумайте, чи ми створили набір даних, що складається зі списку 100 рівномірно розподілених випадкових змінних:
#install (if not already installed) and load tseries package if(!require(tseries)){install.packages('tseries')} #generate a list of 100 uniformly distributed random variables dataset <- runif(100) #conduct Jarque-Bera test jarque.bera.test(dataset)
Це генерує такий результат:
Це говорить нам про те, що статистика тесту становить 8,0807, а значення p тесту — 0,01759. У цьому випадку ми б відхилили нульову гіпотезу про те, що дані нормально розподілені. У нас є достатньо доказів, щоб стверджувати, що дані в цьому прикладі не розподіляються нормально.
Цей результат не повинен дивувати, оскільки створений нами набір даних складається зі 100 випадкових змінних, які мають рівномірний розподіл. Зрештою, дані призначені для рівномірного розподілу, а не нормально.