Python で jarque-bera テストを実行する方法
Jarque-Bera 検定は、標本データが正規分布に対応する歪度と尖度を示すかどうかを判断する適合度検定です。
ハルケ・ベラ検定統計量は常に正の数であり、ゼロから遠ざかるほど、標本データが正規分布に従っていないという証拠が多くなります。
このチュートリアルでは、Python で Jarque-Bera テストを実行する方法を説明します。
Python で Jarque-Bera テストを実行する方法
Python で Jarque-Bera テストを実行するには、Scipy ライブラリのjarque_bera 関数を使用できます。この関数は次の構文を使用します。
ハルケベラ(x)
金:
- x:観測値の表
この関数は検定統計量と対応する p 値を返します。
例1
正規分布に従う 5,000 個の値のリストに対して Jarque-Bera 検定を実行するとします。
import numpy as np import scipy.stats as stats #generate array of 5000 values that follows a standard normal distribution np.random.seed(0) data = np.random.normal(0, 1, 5000) #perform Jarque-Bera test stats.jarque_bera(data) (statistic=1.2287, pvalue=0.54098)
検定統計量は1.2287で、対応する p 値は0.54098です。この p 値は 0.05 未満ではないため、帰無仮説を棄却できません。これらのデータが正規分布とは大きく異なる歪度と尖度を示していると言える十分な証拠はありません。
私たちが生成したデータは正規分布に従う 5,000 個の確率変数で構成されているため、この結果は驚くべきことではありません。
例 2
ここで、一様分布に従う 5,000 個の値のリストに対して Jarque-Bera 検定を実行するとします。
import numpy as np import scipy.stats as stats #generate array of 5000 values that follows a uniform distribution np.random.seed(0) data = np.random.uniform(0, 1, 5000) #perform Jarque-Bera test stats.jarque_bera(data) (statistic=300.1043, pvalue=0.0)
検定統計量は300.1043で、対応する p 値は0.0です。この p 値は 0.05 未満であるため、帰無仮説を棄却します。したがって、これらのデータが正規分布とは大きく異なる歪度と尖度を示すことを主張する十分な証拠があります。
私たちが生成したデータは一様分布に従う 5,000 個の確率変数で構成されており、正規分布とは大きく異なる歪度と尖度を持つはずであるため、この結果も驚くべきことではありません。
ハルケ・ベラ・テストをいつ使用するか
Jarque-Bera 検定は通常、他の正規性検定 (Shapiro-Wilk 検定など) が信頼できない大規模なデータセット (n > 2,000) に使用されます。
これは、データセットが正規分布に従うと想定される分析を実行する前に使用するのに適したテストです。ハルケ・ベラ検定により、この仮定が満たされているかどうかがわかります。