Як виконати тестування під час виконання в python
Запуск тестування — це статистичний тест, який використовується для визначення того, чи набір даних походить від випадкового процесу.
Нульова та альтернативна гіпотези тесту такі:
H 0 (null): дані були створені випадковим чином.
H a (альтернатива): дані не були згенеровані випадковим чином.
Цей підручник пояснює два методи, які можна використовувати для виконання тестових запусків у Python.
Приклад: запустіть тест на Python
Ми можемо виконати тестові запуски заданого набору даних у Python за допомогою функції runstest_1samp() із бібліотеки statsmodels , яка використовує такий синтаксис:
runstest_1samp(x, cutoff=’mean’, correction=True)
золото:
- x: масив значень даних
- cutoff: Порогове значення, яке використовується для поділу даних на великі та малі значення. За умовчанням встановлено «середнє», але ви також можете вказати «медіану» як альтернативу.
- Виправлення: для розміру вибірки менше 50 ця функція віднімає 0,5 як поправку. Ви можете вказати False, щоб вимкнути це виправлення.
Ця функція створює статистику az тесту та відповідне значення p як вихідні дані.
Наступний код показує, як виконати тестовий запуск за допомогою цієї функції в Python:
from statsmodels. sandbox . stats . runs import runstest_1samp #create dataset data = [12, 16, 16, 15, 14, 18, 19, 21, 13, 13] #Perform Runs test runstest_1samp(data, correction= False ) (-0.6708203932499369, 0.5023349543605021)
Статистичний показник z-критерію дорівнює -0,67082 , а відповідне p-значення становить 0,50233 . Оскільки це p-значення не менше α = 0,05, ми не можемо відхилити нульову гіпотезу. У нас є достатньо доказів того, що дані були згенеровані випадковим чином.
Примітка . Для цього прикладу ми вимкнули коригування під час обчислення тестової статистики. Це відповідає формулі, яка використовується для виконання тесту в R , яка не використовує виправлення під час виконання тесту.