完全ガイド: r での仮説テスト
仮説検定は、統計的仮説を棄却または棄却できなかったために使用する正式な統計検定です。
このチュートリアルでは、R で次の仮説テストを実行する方法を説明します。
- サンプル t 検定
- 2 サンプルの T 検定
- 対応のあるサンプルの t 検定
R のt.test()関数を使用して、各タイプのテストを実行できます。
#one sample t-test t. test (x, y = NULL, alternative = c(" two.sided ", " less ", " greater "), mu = 0, paired = FALSE, var.equal = FALSE , conf.level = 0.95, …)
金:
- x、y: 2 つのデータ サンプル。
- 代替:テストの対立仮説。
- mu:平均の真の値。
- ペア:対応のある t 検定を実行するかどうか。
- var.equal: 分散がサンプル間で等しいと仮定するかどうか。
- conf.level:使用する信頼レベル。
次の例は、この関数を実際に使用する方法を示しています。
例 1: R での 1 サンプルの t 検定
1 サンプル t 検定は、母集団の平均が特定の値に等しいかどうかを検定するために使用されます。
たとえば、特定の種のカメの平均体重が 310 ポンドであるかどうかを知りたいとします。私たちは外に出て、次の重みを持つカメの単純でランダムなサンプルを収集します。
重量:300、315、320、311、314、309、300、308、305、303、305、301、303
次のコードは、この t 検定の例を R で実行する方法を示しています。
#define vector of turtle weights turtle_weights <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303) #perform one sample t-test t. test (x=turtle_weights,mu=310) One Sample t-test data: turtle_weights t = -1.5848, df = 12, p-value = 0.139 alternative hypothesis: true mean is not equal to 310 95 percent confidence interval: 303.4236 311.0379 sample estimates: mean of x 307.2308
結果から次のことがわかります。
- t 検定統計量: -1.5848
- 自由度: 12
- p値: 0.139
- 真の平均に対する 95% 信頼区間: [303.4236, 311.0379]
- カメの平均体重: 307,230
検定の p 値 (0.139) は 0.05 未満ではないため、帰無仮説を棄却できません。
これは、このカメ種の平均体重が 310 ポンド以外であると言える十分な証拠がないことを意味します。
例 2: R での 2 サンプルの t 検定
2 標本 t 検定は、 2 つの母集団の平均が等しいかどうかを検定するために使用されます。
たとえば、2 つの異なる種のカメの平均体重が等しいかどうかを知りたいとします。これをテストするために、次の重みを使用して、各種から単純でランダムなカメのサンプルを収集します。
サンプル1 :300、315、320、311、314、309、300、308、305、303、305、301、303
サンプル2 :335、329、322、321、324、319、304、308、305、311、307、300、305
次のコードは、これら 2 つの t 検定の例を R で実行する方法を示しています。
#define vector of turtle weights for each sample sample1 <- c(300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303) sample2 <- c(335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305) #perform two sample t-tests t. test (x = sample1, y = sample2) Welch Two Sample t-test data: sample1 and sample2 t = -2.1009, df = 19.112, p-value = 0.04914 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -14.73862953 -0.03060124 sample estimates: mean of x mean of y 307.2308 314.6154
結果から次のことがわかります。
- t 検定統計量: -2.1009
- 自由度: 19,112
- p値: 0.04914
- 真の平均差の 95% 信頼区間: [-14.74, -0.03]
- サンプル 1 の平均重量: 307.2308
- サンプル 2 の平均重量: 314.6154
検定の p 値 (0.04914) は 0.05 未満であるため、帰無仮説を棄却します。
これは、2 つの種の平均体重が等しくないと言える十分な証拠があることを意味します。
例 3: R での対応のあるサンプルの t 検定
対のあるサンプルの t 検定は、一方のサンプルの各観測値がもう一方のサンプルの観測値と関連付けられる場合に、2 つのサンプルの平均を比較するために使用されます。
たとえば、特定のトレーニング プログラムがバスケットボール選手の最大垂直ジャンプ (インチ単位) を向上させることができるかどうかを知りたいとします。
これをテストするには、12 人の大学バスケットボール選手の単純なランダム サンプルを採用し、それぞれの最大垂直ジャンプを測定します。次に、各プレーヤーにトレーニング プログラムを 1 か月間使用してもらい、月末に最大垂直跳びを再度測定します。
次のデータは、各プレーヤーのトレーニング プログラムを使用する前後の最大ジャンプ高さ (インチ単位) を示しています。
フロント:22、24、20、19、19、20、22、25、24、23、22、21
後:23、25、20、24、18、22、23、28、24、25、24、20
次のコードは、R でこの対応のあるサンプルの t 検定を実行する方法を示しています。
#define before and after max jump heights before <- c(22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21) after <- c(23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20) #perform paired samples t-test t. test (x = before, y = after, paired = TRUE ) Paired t-test data: before and after t = -2.5289, df = 11, p-value = 0.02803 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -2.3379151 -0.1620849 sample estimates: mean of the differences -1.25
結果から次のことがわかります。
- t 検定統計量: -2.5289
- 自由度: 11
- p値: 0.02803
- 真の平均差の 95% 信頼区間: [-2.34, -0.16]
- 前後の平均差: -1.25
検定の p 値 (0.02803) は 0.05 未満であるため、帰無仮説を棄却します。
これは、トレーニング プログラムを使用する前と使用した後の平均ジャンプ高さが等しくないという十分な証拠があることを意味します。
追加リソース
次のオンライン計算ツールを使用して、さまざまな t 検定を自動的に実行します。