R で分散比検定を実行する方法 (例あり)
分散比検定は、 2 つの母集団の分散が等しいかどうかを検定するために使用されます。
この検定では、次の帰無仮説と対立仮説を使用します。
- H 0 : 母集団の分散は等しい
- H A : 母集団の分散は等しくない
このテストを実行するには、次のテスト統計を計算します。
F = s 1 2 / s 2 2
金:
- s 1 2 : 最初のグループの標本分散
- s 2 2 : 2 番目のグループの標本分散
この F 検定統計量に対応するp 値が特定のしきい値 (たとえば、0.05) を下回る場合、帰無仮説は棄却され、母集団の分散は等しくないと結論付けられます。
R で分散比検定を実行するには、組み込み関数var.test()を使用できます。
次の例は、この関数を実際に使用する方法を示しています。
例: R の分散比のテスト
2 つの異なる植物種の高さのばらつきが同じかどうかを知りたいとします。
これをテストするために、各種から 15 個の植物の単純なランダム サンプルを収集します。
次のコードは、R で分散比検定を実行して、2 つの種の間で高さの分散が等しいかどうかを判断する方法を示しています。
#create vectors to hold plant heights from each sample group1 <- c(5, 6, 6, 8, 10, 12, 12, 13, 14, 15, 15, 17, 18, 18, 19) group2 <- c(9, 9, 10, 12, 12, 13, 14, 16, 16, 19, 22, 24, 26, 29, 29) #perform variance ratio test var. test (group1, group2) F test to compare two variances data: group1 and group2 F = 0.43718, num df = 14, denom df = 14, p-value = 0.1336 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.1467737 1.3021737 sample estimates: ratio of variances 0.4371783
テスト結果を解釈する方法は次のとおりです。
data:サンプル データを含むベクトルの名前。
F: F 検定統計量。この場合、それは0.43718です。
num df、denom df : F 検定統計量の分子と分母の自由度。それぞれ n 1 – 1 および n 2 -1 として計算されます。
p 値:分子 df = 14、分母 df = 14 の F 検定統計量 0.43718 に対応する p 値。p 値は0.1336であることがわかります。
95% 信頼区間: 2 つのグループ間の真の分散比の 95% 信頼区間。 [.147, 1.302]であることがわかります。この区間には 1 が含まれているため、真の分散比は 1、つまり分散が等しいと考えられます。
サンプル推定値:これは各グループ間の分散の比率を表します。 var()関数を使用すると、最初のグループの標本分散が 21.8381、2 番目のグループの標本分散が 49.95238 であることがわかります。したがって、分散比は 21.8381 / 49.95238 = 0.4371783となります。
この検定の帰無仮説と対立仮説を思い出してください。
- H 0 : 母集団の分散は等しい
- H A : 母集団の分散は等しくない
検定の p 値(0.1336)は 0.05 未満ではないため、帰無仮説を棄却できません。
これは、2 つの種の間の草丈の差異が不均等であると結論付けるのに十分な証拠がないことを意味します。
追加リソース
次のチュートリアルでは、R で他の一般的なタスクを実行する方法について説明します。
R で 1 サンプルの T 検定を実行する方法
R でウェルチの T 検定を実行する方法
R で対応のあるサンプルの t 検定を実行する方法