Python で実行時テストを実行する方法
実行テストは、データセットがランダムなプロセスからのものであるかどうかを判断するために使用される統計テストです。
検定の帰無仮説と対立仮説は次のとおりです。
H 0 (null): データはランダムに生成されました。
H a (代替): データはランダムに生成されませんでした。
このチュートリアルでは、Python でテスト実行を実行するために使用できる 2 つの方法について説明します。
例: Python でテストを実行する
statsmodelsライブラリのruntest_1samp()関数を使用して、Python で特定のデータセットに対してテスト実行を実行できます。この関数は次の構文を使用します。
runtest_1samp(x, カットオフ = ‘平均’, 修正 = True)
金:
- x:データ値の配列
- カットオフ:データを大きい値と小さい値に分割するために使用するしきい値。デフォルトは「平均」ですが、代わりに「中央値」を指定することもできます。
- 補正:サンプル サイズが 50 未満の場合、この関数は補正として 0.5 を減算します。 False を指定すると、この修正を無効にできます。
この関数は、z 検定統計量と対応する p 値を出力として生成します。
次のコードは、Python でこの関数を使用してテスト実行を実行する方法を示しています。
from statsmodels. sandbox . stats . runs import runstest_1samp #create dataset data = [12, 16, 16, 15, 14, 18, 19, 21, 13, 13] #Perform Runs test runstest_1samp(data, correction= False ) (-0.6708203932499369, 0.5023349543605021)
Z 検定統計量は-0.67082であり、対応する p 値は0.50233であることがわかります。この p 値は α = 0.05 以上であるため、帰無仮説を棄却できません。データがランダムに生成されたと言える十分な証拠があります。
注: この例では、検定統計量を計算する際の補正を無効にしました。これは、 R でテスト実行を実行するために使用される式と一致します。テスト実行時に補正は使用されません。