R で信頼区間を求める方法 (例付き)
信頼区間は、一定の信頼レベルで母集団パラメータが含まれる可能性が高い値の範囲です。
次の一般式に従って計算されます。
信頼区間= (点推定値) +/- (臨界値)* (標準誤差)
この式は、下限と上限を持つ区間を作成します。これには、ある程度の信頼度のある母集団パラメータが含まれる可能性があります。
信頼区間= [下限、上限]
このチュートリアルでは、R で次の信頼区間を計算する方法を説明します。
1.平均値の信頼区間
2.平均値の差の信頼区間
3.割合の信頼区間
4.比率の差の信頼区間
さあ行こう!
例 1: 平均値の信頼区間
次の式を使用して、 平均の信頼区間を計算します。
信頼区間 = x +/- t n-1, 1-α/2 *(s/√n)
金:
- x :サンプル平均
- t: t 臨界値
- s:サンプルの標準偏差
- n:サンプルサイズ
例:次の情報を含むカメのランダムなサンプルを収集するとします。
- サンプルサイズn = 25
- 平均サンプル重量x = 300
- サンプル標準偏差s = 18.5
次のコードは、カメ個体群の真の平均体重の 95% 信頼区間を計算する方法を示しています。
#input sample size, sample mean, and sample standard deviation n <- 25 xbar <- 300 s <- 18.5 #calculate margin of error margin <- qt(0.975,df=n-1)*s/sqrt(n) #calculate lower and upper bounds of confidence interval low <- xbar - margin low [1] 292.3636 high <- xbar + margin high [1] 307.6364
カメ個体群の真の平均体重の 95% 信頼区間は[292.36, 307.64]です。
例 2: 平均値の差の信頼区間
次の式を使用して、 母平均の差の信頼区間を計算します。
信頼区間= ( x 1 – x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))
金:
- x 1 、 x 2 : サンプル 1 の平均、サンプル 2 の平均
- t: 信頼水準と (n 1 + n 2 -2) 自由度に基づく t 臨界値
- s p 2 : プールされた分散、((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2) として計算されます。
- t: t 臨界値
- n 1 、n 2 : サンプルサイズ 1、サンプルサイズ 2
例: 2 つの異なる種のカメの平均体重の差を推定したいとします。したがって、各集団から 15 匹のカメのランダムなサンプルを収集します。各サンプルの概要データは次のとおりです。
サンプル 1:
- x1 = 310
- s1 = 18.5
- n 1 = 15
サンプル 2:
- x2 = 300
- s2 = 16.4
- n2 = 15
次のコードは、母平均の真の差の 95% 信頼区間を計算する方法を示しています。
#input sample size, sample mean, and sample standard deviation n1 <- 15 xbar1 <- 310 s1 <- 18.5 n2 <- 15 xbar2 <- 300 s2 <- 16.4 #calculate pooled variance sp = ((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n2-2) #calculate margin of error margin <- qt(0.975,df=n1+n2-1)*sqrt(sp/n1 + sp/n2) #calculate lower and upper bounds of confidence interval low <- (xbar1-xbar2) - margin low [1] -3.055445 high <- (xbar1-xbar2) + margin high [1] 23.05544
母集団平均間の真の差の 95% 信頼区間は[-3.06, 23.06]です。
例 3: 比率の信頼区間
次の式を使用して、 割合の信頼区間を計算します。
信頼区間 = p +/- z*(√ p(1-p) / n )
金:
- p:サンプル割合
- z:選択された Z 値
- n:サンプルサイズ
例:特定の法律を支持する郡の住民の割合を推定したいとします。私たちは住民 100 人のサンプルを無作為に選び、法律に対する彼らの立場を尋ねました。結果は次のとおりです。
- サンプルサイズn = 100
- 法律を支持する割合p = 0.56
次のコードは、この法律を支持する郡全体の住民の真の割合の 95% 信頼区間を計算する方法を示しています。
#input sample size and sample proportion n <- 100 p <- .56 #calculate margin of error margin <- qnorm(0.975)*sqrt(p*(1-p)/n) #calculate lower and upper bounds of confidence interval low <- p - margin low [1] 0.4627099 high <- p + margin high [1] 0.6572901
この法律を支持する郡全体の住民の真の割合の 95% 信頼区間は[.463, .657]です。
例 4: 比率の差の信頼区間
次の式を使用して、 比率の差の信頼区間を計算します。
信頼区間 = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )
金:
- p 1 、p 2 : サンプル 1 の割合、サンプル 2 の割合
- z: 信頼水準に基づく z 臨界値
- n 1 、n 2 : サンプルサイズ 1、サンプルサイズ 2
例: A 郡の特定の法律を支持する住民の割合と B 郡の法律を支持する住民の割合の差を推定したいとします。各サンプルの概要データは次のとおりです。
サンプル 1:
- n 1 = 100
- p 1 = 0.62 (つまり、住民 100 人中 62 人が法律を支持)
サンプル 2:
- n2 = 100
- p 2 = 0.46 (つまり、住民 100 人中 46 人が法律を支持)
次のコードは、郡間の法律を支持する住民の割合の真の差異の 95% 信頼区間を計算する方法を示しています。
#input sample sizes and sample proportions n1 <- 100 p1 <- .62 n2 <- 100 p2 <- .46 #calculate margin of error margin <- qnorm(0.975)*sqrt(p1*(1-p1)/n1 + p2*(1-p2)/n2) #calculate lower and upper bounds of confidence interval low <- (p1-p2) - margin low [1] 0.02364509 high <- (p1-p2) + margin high [1] 0.2963549
郡間の法律を支持する住民の割合の真の差異の 95% 信頼区間は[0.024, 0.296]です。
その他の R チュートリアルはここで見つけることができます。