Як виконати тест жарке-бера в python


Тест Жарке-Бера — це тест на відповідність, який визначає, чи демонструють вибіркові дані асиметрію та ексцес, які відповідають нормальному розподілу.

Статистика тесту Жарке-Бера завжди є додатним числом, і чим далі воно від нуля, тим більше є доказів того, що вибіркові дані не відповідають нормальному розподілу.

Цей підручник пояснює, як виконати тест Жарке-Бера в Python.

Як виконати тест Жарке-Бера в Python

Щоб виконати тест Jarque-Bera в Python, ви можете використати функцію jarque_bera з бібліотеки Scipy, яка використовує такий синтаксис:

jarque_bera(x)

золото:

  • x: таблиця спостережень

Ця функція повертає тестову статистику та відповідне значення p.

Приклад 1

Припустимо, ми виконуємо перевірку Жарке-Бера на списку з 5000 значень, які відповідають нормальному розподілу:

 import numpy as np
import scipy.stats as stats

#generate array of 5000 values that follows a standard normal distribution
np.random.seed(0)
data = np.random.normal(0, 1, 5000)

#perform Jarque-Bera test
stats.jarque_bera(data)

(statistic=1.2287, pvalue=0.54098)

Статистика тесту становить 1,2287 , а відповідне значення p — 0,54098 . Оскільки це p-значення не менше 0,05, ми не можемо відхилити нульову гіпотезу. У нас недостатньо доказів, щоб стверджувати, що ці дані демонструють асимметрию та ексцес, які суттєво відрізняються від нормального розподілу.

Цей результат не повинен дивувати, оскільки дані, які ми згенерували, складаються з 5000 випадкових змінних, які відповідають нормальному розподілу.

Приклад 2

Тепер припустімо, що ми виконуємо тест Жарке-Бера на списку з 5000 значень, які відповідають рівномірному розподілу:

 import numpy as np
import scipy.stats as stats

#generate array of 5000 values that follows a uniform distribution
np.random.seed(0)
data = np.random.uniform(0, 1, 5000)

#perform Jarque-Bera test
stats.jarque_bera(data)

(statistic=300.1043, pvalue=0.0)

Статистика тесту становить 300,1043 , а відповідне значення p — 0,0 . Оскільки це p-значення менше 0,05, ми відхиляємо нульову гіпотезу. Таким чином, у нас є достатньо доказів, щоб стверджувати, що ці дані виявляють суттєво інші асимметрию та ексцес, ніж нормальний розподіл.

Цей результат також не повинен бути дивним, оскільки дані, які ми згенерували, складаються з 5000 випадкових змінних, які слідують рівномірному розподілу, який повинен мати асимметрию та ексцес, які дуже відрізняються від нормального розподілу.

Коли використовувати тест Жарке-Бера

Тест Жарке-Бера зазвичай використовується для великих наборів даних (n > 2000), у яких інші тести нормальності (такі як тест Шапіро-Вілка) ненадійні.

Це відповідний тест для використання перед виконанням аналізу, у якому передбачається, що набір даних відповідає нормальному розподілу. Тест Жарке-Бера може сказати, чи виконується це припущення чи ні.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *