Python でクラスカル-ウォリス テストを実行する方法
クラスカル・ウォリス検定は、 3 つ以上の独立したグループの中央値間に統計的に有意な差があるかどうかを判断するために使用されます。
これは、一元配置 ANOVAと同等のノンパラメトリックとみなされます。
このチュートリアルでは、Python でクラスカル-ウォリス テストを実行する方法を説明します。
例: Python でのクラスカル-ウォリス テスト
研究者は、3 つの異なる肥料が異なるレベルの植物の成長につながるかどうかを知りたいと考えています。彼らは 30 個の異なる植物をランダムに選択し、10 個ずつ 3 つのグループに分け、各グループに異なる肥料を適用します。 1 か月後、各植物の高さを測定します。
次の手順に従ってクラスカル-ウォリス検定を実行し、3 つのグループすべてで成長中央値が同じかどうかを判断します。
ステップ 1: データを入力します。
まず、3 つのグループごとに植物の測定値を保持する 3 つのテーブルを作成します。
group1 = [7, 14, 14, 13, 12, 9, 6, 14, 12, 8] group2 = [15, 17, 13, 15, 15, 13, 9, 12, 10, 8] group3 = [6, 8, 8, 9, 5, 14, 13, 8, 10, 9]
ステップ 2: クラスカル-ウォリス検定を実行します。
次に、scipy.stats ライブラリのkruskal() 関数を使用して、Kruskal-Wallis テストを実行します。
from scipy import stats #perform Kruskal-Wallis Test stats.kruskal(group1, group2, group3) (statistic=6.2878, pvalue=0.0431)
ステップ 3: 結果を解釈します。
クラスカル-ウォリス検定では、次の帰無仮説と対立仮説を使用します。
帰無仮説 (H 0 ):中央値はすべてのグループで等しい。
対立仮説: (Ha):中央値はすべてのグループで等しくありません。
この場合、検定統計量は6.2878で、対応する p 値は0.0431です。この p 値は 0.05 未満であるため、植物の成長の中央値が 3 つの肥料すべてで同じであるという帰無仮説を棄却できます。私たちは、使用される肥料の種類が植物の成長に統計的に有意な差を引き起こすと結論付けるのに十分な証拠を持っています。