R でクラスカル・ウォリス検定を実行する方法
クラスカル・ウォリス検定は、 3 つ以上の独立したグループの中央値間に統計的に有意な差があるかどうかを判断するために使用されます。
これは、一元配置 ANOVAと同等のノンパラメトリックとみなされます。
このチュートリアルでは、R でクラスカル-ウォリス テストを実行する方法について説明します。
例: R でのクラスカル・ウォリス検定
研究者が、3 つの異なる肥料が異なるレベルの植物の成長につながるかどうかを知りたいと考えているとします。彼らは 30 個の異なる植物をランダムに選択し、10 個ずつ 3 つのグループに分け、各グループに異なる肥料を適用します。 1 か月後、各植物の高さを測定します。
次の手順に従ってクラスカル-ウォリス検定を実行し、3 つのグループすべてで成長中央値が同じかどうかを判断します。
ステップ 1: データを入力します。
まず、30 種類の植物の成長とその肥料グループを含む次のデータ フレームを作成します。
#create data frame df <- data. frame (group=rep(c(' A ', ' B ', ' C '), each= 10 ), height=c(7, 14, 14, 13, 12, 9, 6, 14, 12, 8, 15, 17, 13, 15, 15, 13, 9, 12, 10, 8, 6, 8, 8, 9, 5, 14, 13, 8, 10, 9)) #view first six rows of data frame head(df) group height 1 to 7 2 to 14 3 to 14 4 to 13 5 to 12 6 to 9
ステップ 2: クラスカル-ウォリス検定を実行します。
次に、R データベースの組み込みkruskal.test()関数を使用して、クラスカル-ウォリス テストを実行します。
#perform Kruskal-Wallis Test kruskal. test (height ~ group, data = df) Kruskal-Wallis rank sum test data: height by group Kruskal-Wallis chi-squared = 6.2878, df = 2, p-value = 0.04311
ステップ 3: 結果を解釈します。
クラスカル-ウォリス検定では、次の帰無仮説と対立仮説を使用します。
帰無仮説 (H 0 ):中央値はすべてのグループで等しい。
対立仮説: ( HA ):中央値はすべてのグループで等しくありません。
この場合、検定統計量は6.2878で、対応する p 値は0.0431です。
このp 値は 0.05 未満であるため、植物の成長の中央値が 3 つの肥料すべてで同じであるという帰無仮説を棄却できます。
これは、使用される肥料の種類が植物の成長に統計的に有意な差を引き起こすと結論付けるのに十分な証拠があることを意味します。
追加リソース
次のチュートリアルでは、R で他の一般的な統計テストを実行する方法について説明します。
R で対応のあるサンプルの t 検定を実行する方法
R で一元配置分散分析を実行する方法
R で反復測定 ANOVA を実行する方法