R で 2 サンプル t 検定を実行する方法
2 標本 t 検定は、 2 つの母集団の平均が等しいかどうかを検定するために使用されます。
次の基本構文を使用して、R で 2 つの例の t 検定を実行できます。
t. test (group1, group2, var. equal = TRUE )
注: var.equal=TRUEを指定することにより、分散が 2 つのサンプル間で等しいと仮定するように R に指示します。
この仮定をしたくない場合は、この引数を脇に置いておいて、R は代わりにサンプル間の分散が等しいことを仮定しないウェルチの t 検定を実行します。
次の例は、R で 2 サンプルの t 検定を実際に実行する方法を示しています。
例: R での 2 サンプル T 検定
2 つの異なる種の植物の平均高さが同じかどうかを知りたいとします。
これをテストするために、各種から 12 個の植物の単純なランダム サンプルを収集します。
次のコードは、R で 2 サンプルの t 検定を実行して、2 つの種の間で平均身長が等しいかどうかを判断する方法を示しています。
#create vectors to hold plant heights from each sample group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19) group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19) #perform two sample t-tests t. test (group1, group2, var. equal = TRUE ) Two Sample t-test data: group1 and group2 t = -2.5505, df = 22, p-value = 0.01823 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.5904820 -0.5761847 sample estimates: mean of x mean of y 11.66667 14.75000
テスト結果を解釈する方法は次のとおりです。
data:サンプル データを含むベクトルの名前。
t: t 検定統計量。この場合、それは-2.5505です。
df : 自由度。 n 1 + n 2 – 2 = 12 + 12 – 2 = 22として計算されます。
p 値:検定統計量 -2.5505 および df = 22 に対応する p 値。p 値は.01823であることがわかります。この値は、 T スコアから P 値への計算ツールを使用して確認できます。
95% 信頼区間: 2 つのグループ間の平均値の真の差の 95% 信頼区間。 [-5.59, -.576]であることがわかります。
サンプル推定値:各グループのサンプル平均。この場合、グループ 1 のサンプル平均は11.667で、グループ 2 のサンプル平均は14.75でした。
この特定の 2 サンプル t 検定の帰無仮説と対立仮説は次のとおりです。
H 0 : μ 1 = μ 2 (2 つの母集団平均は等しい)
H A : µ 1 ≠µ 2 (2 つの母集団平均は等しくありません)
検定の p 値(0.01823)は 0.05 未満であるため、帰無仮説は棄却されます。
これは、2 つの種の平均草丈が等しくないと結論付けるのに十分な証拠があることを意味します。
技術的なメモ
R のt.test()関数は次の構文を使用します。
t. test (x, y, alternative="two.sided", mu=0, paired=FALSE, var.equal=FALSE, conf.level=0.95)
金:
- x、y:データを含む 2 つのベクトルの名前。
- 代替:対立仮説。オプションには「両面」、「縮小」、または「拡大」が含まれます。
- mu:平均値の真の差であると想定される値。
- 対応のある:対応のある t 検定を使用するかどうか。
- var.equal: 2 つのグループ間の差が等しいかどうか。
- conf.level:テストに使用する信頼レベル。
独自の t 検定を実行するときは、実行する特定の検定に応じて、これらの引数を自由に変更してください。
追加リソース
次のチュートリアルでは、R で他の一般的なタスクを実行する方法について説明します。
R で 1 サンプルの T 検定を実行する方法
R でウェルチの T 検定を実行する方法
R で対応のあるサンプル t 検定を実行する方法