Python で臨界カイ二乗値を見つける方法
カイ二乗検定を実行すると、検定統計量が得られます。カイ二乗検定の結果が統計的に有意であるかどうかを判断するには、検定統計量を臨界カイ二乗値と比較します。検定統計量が臨界カイ二乗値より大きい場合、検定結果は統計的に有意です。
臨界カイ二乗値は、カイ二乗分布表または統計ソフトウェアを使用して見つけることができます。
重要なカイ二乗値を見つけるには、以下が必要です。
- 有意水準 (一般的な選択は 0.01、0.05、および 0.10)
- 自由度
これら 2 つの値を使用して、検定統計量と比較するカイ二乗値を決定できます。
Python で臨界カイ二乗値を見つける方法
Python で重要なカイ 2 乗値を見つけるには、次の構文を使用するscipy.stats.chi2.ppf() 関数を使用できます。
scipy.stats.chi2.ppf(q, df)
金:
- q:使用する重要度
- df : 自由度
この関数は、指定された有意水準と自由度に基づいてカイ二乗分布の臨界値を返します。
たとえば、有意水準 0.05、自由度 = 11 の臨界カイ二乗値を見つけたいとします。
import scipy.stats #find Chi-Square critical value scipy.stats.chi2.ppf(1-.05, df=11) 19.67514
有意水準 0.05、自由度 = 11 の臨界カイ二乗値は19.67514です。
したがって、何らかの種類のカイ二乗検定を実行すると、カイ二乗検定統計量を19.67514と比較できます。テスト統計量が 19.67514 より大きい場合、テスト結果は統計的に有意です。
アルファ値が小さいほど、臨界カイ二乗値が高くなることに注意してください。たとえば、有意水準0.01 、自由度 = 11 の臨界カイ二乗値を考えてみましょう。
scipy.stats.chi2.ppf(1-.01, df=11) 24.72497
そして、まったく同じ自由度で、ただし有意水準が0.005である臨界カイ 2 乗値を考えてみましょう。
scipy.stats.chi2.ppf(1-.005 df=11) 26.75685
chi2.ppf() 関数の正確な詳細については、 SciPy のドキュメントを参照してください。