如何在 python 中执行运行时测试
运行测试是一种统计测试,用于确定数据集是否来自随机过程。
检验的原假设和备择假设如下:
H 0 (空):数据是随机产生的。
H a (替代):数据不是随机生成的。
本教程介绍了两种可用于在 Python 中执行测试运行的方法。
示例:在 Python 中运行测试
我们可以使用statsmodels库中的runningtest_1samp()函数在 Python 中对给定数据集执行测试运行,该函数使用以下语法:
runtest_1samp(x, cutoff=’mean’, Correction=True)
金子:
- x:数据值数组
- cutoff:用于将数据分为大值和小值的阈值。默认值为“平均”,但您也可以指定“中位数”作为替代。
- 修正:对于小于 50 的样本量,此函数减去 0.5 作为修正。您可以指定 False 来禁用此修复。
该函数生成 az 检验统计量和相应的 p 值作为输出。
以下代码展示了如何在 Python 中使用此函数执行测试运行:
from statsmodels. sandbox . stats . runs import runstest_1samp #create dataset data = [12, 16, 16, 15, 14, 18, 19, 21, 13, 13] #Perform Runs test runstest_1samp(data, correction= False ) (-0.6708203932499369, 0.5023349543605021)
z 检验统计量结果为-0.67082 ,相应的 p 值为0.50233 。由于该 p 值不小于 α = 0.05,因此我们无法拒绝原假设。我们有足够的证据表明数据是随机生成的。
注意:对于此示例,我们在计算检验统计量时禁用了校正。这与用于 在 R 中执行测试运行的公式相匹配,该公式在运行测试时不使用更正。