Як виконати тест жарке-бера в python
Тест Жарке-Бера — це тест на відповідність, який визначає, чи демонструють вибіркові дані асиметрію та ексцес, які відповідають нормальному розподілу.
Статистика тесту Жарке-Бера завжди є додатним числом, і чим далі воно від нуля, тим більше є доказів того, що вибіркові дані не відповідають нормальному розподілу.
Цей підручник пояснює, як виконати тест Жарке-Бера в Python.
Як виконати тест Жарке-Бера в Python
Щоб виконати тест Jarque-Bera в Python, ви можете використати функцію jarque_bera з бібліотеки Scipy, яка використовує такий синтаксис:
jarque_bera(x)
золото:
- x: таблиця спостережень
Ця функція повертає тестову статистику та відповідне значення p.
Приклад 1
Припустимо, ми виконуємо перевірку Жарке-Бера на списку з 5000 значень, які відповідають нормальному розподілу:
import numpy as np import scipy.stats as stats #generate array of 5000 values that follows a standard normal distribution np.random.seed(0) data = np.random.normal(0, 1, 5000) #perform Jarque-Bera test stats.jarque_bera(data) (statistic=1.2287, pvalue=0.54098)
Статистика тесту становить 1,2287 , а відповідне значення p — 0,54098 . Оскільки це p-значення не менше 0,05, ми не можемо відхилити нульову гіпотезу. У нас недостатньо доказів, щоб стверджувати, що ці дані демонструють асимметрию та ексцес, які суттєво відрізняються від нормального розподілу.
Цей результат не повинен дивувати, оскільки дані, які ми згенерували, складаються з 5000 випадкових змінних, які відповідають нормальному розподілу.
Приклад 2
Тепер припустімо, що ми виконуємо тест Жарке-Бера на списку з 5000 значень, які відповідають рівномірному розподілу:
import numpy as np import scipy.stats as stats #generate array of 5000 values that follows a uniform distribution np.random.seed(0) data = np.random.uniform(0, 1, 5000) #perform Jarque-Bera test stats.jarque_bera(data) (statistic=300.1043, pvalue=0.0)
Статистика тесту становить 300,1043 , а відповідне значення p — 0,0 . Оскільки це p-значення менше 0,05, ми відхиляємо нульову гіпотезу. Таким чином, у нас є достатньо доказів, щоб стверджувати, що ці дані виявляють суттєво інші асимметрию та ексцес, ніж нормальний розподіл.
Цей результат також не повинен бути дивним, оскільки дані, які ми згенерували, складаються з 5000 випадкових змінних, які слідують рівномірному розподілу, який повинен мати асимметрию та ексцес, які дуже відрізняються від нормального розподілу.
Коли використовувати тест Жарке-Бера
Тест Жарке-Бера зазвичай використовується для великих наборів даних (n > 2000), у яких інші тести нормальності (такі як тест Шапіро-Вілка) ненадійні.
Це відповідний тест для використання перед виконанням аналізу, у якому передбачається, що набір даних відповідає нормальному розподілу. Тест Жарке-Бера може сказати, чи виконується це припущення чи ні.