R で信頼区間を求める方法 (例付き)


信頼区間は、一定の信頼レベルで母集団パラメータが含まれる可能性が高い値の範囲です。

次の一般式に従って計算されます。

信頼区間= (点推定値) +/- (臨界値)* (標準誤差)

この式は、下限と上限を持つ区間を作成します。これには、ある程度の信頼度のある母集団パラメータが含まれる可能性があります。

信頼区間= [下限、上限]

このチュートリアルでは、R で次の信頼区間を計算する方法を説明します。

1.平均値の信頼区間

2.平均値の差の信頼区間

3.割合の信頼区間

4.比率の差の信頼区間

さあ行こう!

例 1: 平均値の信頼区間

次の式を使用して、 平均の信頼区間を計算します。

信頼区間 = x +/- t n-1, 1-α/2 *(s/√n)

金:

  • x :サンプル平均
  • t: t 臨界値
  • s:サンプルの標準偏差
  • n:サンプルサイズ

例:次の情報を含むカメのランダムなサンプルを収集するとします。

  • サンプルサイズn = 25
  • 平均サンプル重量x = 300
  • サンプル標準偏差s = 18.5

次のコードは、カメ個体群の真の平均体重の 95% 信頼区間を計算する方法を示しています。

 #input sample size, sample mean, and sample standard deviation
n <- 25
xbar <- 300 
s <- 18.5

#calculate margin of error
margin <- qt(0.975,df=n-1)*s/sqrt(n)

#calculate lower and upper bounds of confidence interval
low <- xbar - margin
low

[1] 292.3636

high <- xbar + margin
high

[1] 307.6364

カメ個体群の真の平均体重の 95% 信頼区間は[292.36, 307.64]です。

例 2: 平均値の差の信頼区間

次の式を使用して、 母平均の差の信頼区間を計算します。

信頼区間= ( x 1x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))

金:

  • x 1x 2 : サンプル 1 の平均、サンプル 2 の平均
  • t: 信頼水準と (n 1 + n 2 -2) 自由度に基づく t 臨界値
  • s p 2 : プールされた分散、((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2) として計算されます。
  • t: t 臨界値
  • n 1 、n 2 : サンプルサイズ 1、サンプルサイズ 2

例: 2 つの異なる種のカメの平均体重の差を推定したいとします。したがって、各集団から 15 匹のカメのランダムなサンプルを収集します。各サンプルの概要データは次のとおりです。

サンプル 1:

  • x1 = 310
  • s1 = 18.5
  • n 1 = 15

サンプル 2:

  • x2 = 300
  • s2 = 16.4
  • n2 = 15

次のコードは、母平均の真の差の 95% 信頼区間を計算する方法を示しています。

 #input sample size, sample mean, and sample standard deviation
n1 <- 15
xbar1 <- 310 
s1 <- 18.5

n2 <- 15
xbar2 <- 300
s2 <- 16.4

#calculate pooled variance
sp = ((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n2-2)

#calculate margin of error
margin <- qt(0.975,df=n1+n2-1)*sqrt(sp/n1 + sp/n2)

#calculate lower and upper bounds of confidence interval
low <- (xbar1-xbar2) - margin
low

[1] -3.055445

high <- (xbar1-xbar2) + margin
high

[1] 23.05544

母集団平均間の真の差の 95% 信頼区間は[-3.06, 23.06]です。

例 3: 比率の信頼区間

次の式を使用して、 割合の信頼区間を計算します。

信頼区間 = p +/- z*(√ p(1-p) / n )

金:

  • p:サンプル割合
  • z:選択された Z 値
  • n:サンプルサイズ

例:特定の法律を支持する郡の住民の割合を推定したいとします。私たちは住民 100 人のサンプルを無作為に選び、法律に対する彼らの立場を尋ねました。結果は次のとおりです。

  • サンプルサイズn = 100
  • 法律を支持する割合p = 0.56

次のコードは、この法律を支持する郡全体の住民の真の割合の 95% 信頼区間を計算する方法を示しています。

 #input sample size and sample proportion
n <- 100
p <- .56

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p*(1-p)/n)

#calculate lower and upper bounds of confidence interval
low <- p - margin
low

[1] 0.4627099

high <- p + margin
high

[1] 0.6572901

この法律を支持する郡全体の住民の真の割合の 95% 信頼区間は[.463, .657]です。

例 4: 比率の差の信頼区間

次の式を使用して、 比率の差の信頼区間を計算します。

信頼区間 = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )

金:

  • p 1 、p 2 : サンプル 1 の割合、サンプル 2 の割合
  • z: 信頼水準に基づく z 臨界値
  • n 1 、n 2 : サンプルサイズ 1、サンプルサイズ 2

例: A 郡の特定の法律を支持する住民の割合と B 郡の法律を支持する住民の割合の差を推定したいとします。各サンプルの概要データは次のとおりです。

サンプル 1:

  • n 1 = 100
  • p 1 = 0.62 (つまり、住民 100 人中 62 人が法律を支持)

サンプル 2:

  • n2 = 100
  • p 2 = 0.46 (つまり、住民 100 人中 46 人が法律を支持)

次のコードは、郡間の法律を支持する住民の割合の真の差異の 95% 信頼区間を計算する方法を示しています。

 #input sample sizes and sample proportions
n1 <- 100
p1 <- .62

n2 <- 100
p2 <- .46

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p1*(1-p1)/n1 + p2*(1-p2)/n2)

#calculate lower and upper bounds of confidence interval
low <- (p1-p2) - margin
low

[1] 0.02364509


high <- (p1-p2) + margin
high

[1] 0.2963549

郡間の法律を支持する住民の割合の真の差異の 95% 信頼区間は[0.024, 0.296]です。

その他の R チュートリアルはここで見つけることができます。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です