Як знайти довірчі інтервали в r (з прикладами)


Довірчий інтервал – це діапазон значень, який, ймовірно, містить параметр сукупності з певним рівнем довіри.

Розраховується за такою загальною формулою:

Довірчий інтервал = (точкова оцінка) +/- (критичне значення)* (стандартна помилка)

Ця формула створює інтервал із нижньою межею та верхньою межею, який, ймовірно, містить параметр сукупності з певним рівнем достовірності:

Довірчий інтервал = [нижня межа, верхня межа]

У цьому посібнику пояснюється, як обчислити такі довірчі інтервали в R:

1. Довірчий інтервал для середнього

2. Довірчий інтервал для різниці середніх

3. Довірчий інтервал для пропорції

4. Довірчий інтервал різниці пропорцій

Ходімо!

Приклад 1: Довірчий інтервал для середнього

Ми використовуємо таку формулу, щоб обчислити довірчий інтервал для середнього :

Довірчий інтервал = x +/- t n-1, 1-α/2 *(s/√n)

золото:

  • x : вибірка середніх
  • t: t-критичне значення
  • s: вибіркове стандартне відхилення
  • n: розмір вибірки

Приклад: припустимо, ми збираємо випадкову вибірку черепах із такою інформацією:

  • Обсяг вибірки n = 25
  • Середня маса зразка х = 300
  • Стандартне відхилення вибірки s = 18,5

Наступний код показує, як обчислити 95% довірчий інтервал для справжньої середньої ваги популяції черепах:

 #input sample size, sample mean, and sample standard deviation
n <- 25
xbar <- 300 
s <- 18.5

#calculate margin of error
margin <- qt(0.975,df=n-1)*s/sqrt(n)

#calculate lower and upper bounds of confidence interval
low <- xbar - margin
low

[1] 292.3636

high <- xbar + margin
high

[1] 307.6364

95% довірчий інтервал для справжньої середньої ваги популяції черепах становить [292,36, 307,64] .

Приклад 2: Довірчий інтервал для різниці середніх

Ми використовуємо наступну формулу для розрахунку довірчого інтервалу для різниці в середніх сукупності :

Довірчий інтервал = ( x 1x 2 ) +/- t*√ ((s p 2 /n 1 ) + (s p 2 /n 2 ))

золото:

  • x 1 , x 2 : середнє значення зразка 1, середнє значення зразка 2
  • t: t-критичне значення на основі рівня довіри та (n 1 + n 2 -2) ступенів свободи
  • s p 2 : сукупна дисперсія, обчислена як ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
  • t: t-критичне значення
  • n 1 , n 2 : розмір вибірки 1, розмір вибірки 2

Приклад: припустимо, ми хочемо оцінити різницю в середній вазі між двома різними видами черепах. Тому ми збираємо випадкову вибірку з 15 черепах з кожної популяції. Ось підсумкові дані для кожного зразка:

Зразок 1:

  • х1 = 310
  • s 1 = 18,5
  • n 1 = 15

Зразок 2:

  • х2 = 300
  • s2 = 16,4
  • n2 = 15

У наведеному нижче коді показано, як обчислити 95% довірчий інтервал для справжньої різниці в середніх значеннях сукупності:

 #input sample size, sample mean, and sample standard deviation
n1 <- 15
xbar1 <- 310 
s1 <- 18.5

n2 <- 15
xbar2 <- 300
s2 <- 16.4

#calculate pooled variance
sp = ((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n2-2)

#calculate margin of error
margin <- qt(0.975,df=n1+n2-1)*sqrt(sp/n1 + sp/n2)

#calculate lower and upper bounds of confidence interval
low <- (xbar1-xbar2) - margin
low

[1] -3.055445

high <- (xbar1-xbar2) + margin
high

[1] 23.05544

95% довірчий інтервал для справжньої різниці між середніми сукупностями становить [-3,06, 23,06] .

Приклад 3: Довірчий інтервал для пропорції

Ми використовуємо таку формулу, щоб обчислити довірчий інтервал для пропорції :

Довірчий інтервал = p +/- z*(√ p(1-p) / n )

золото:

  • p: частка зразка
  • z: вибране значення z
  • n: розмір вибірки

Приклад: припустимо, ми хочемо оцінити частку жителів округу, які підтримують певний закон. Ми відбираємо випадкову вибірку зі 100 мешканців і запитуємо їхню позицію щодо закону. Ось результати:

  • Обсяг вибірки n = 100
  • Частка на користь закону р = 0,56

Наступний код показує, як обчислити 95% довірчий інтервал для справжньої частки жителів округу, які підтримують закон:

 #input sample size and sample proportion
n <- 100
p <- .56

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p*(1-p)/n)

#calculate lower and upper bounds of confidence interval
low <- p - margin
low

[1] 0.4627099

high <- p + margin
high

[1] 0.6572901

95% довірчий інтервал для справжньої частки жителів округу, які підтримують закон, становить [0,463, 0,657] .

Приклад 4: Довірчий інтервал для різниці в пропорціях

Ми використовуємо наступну формулу для розрахунку довірчого інтервалу для різниці в пропорціях :

Довірчий інтервал = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )

золото:

  • p 1 , p 2 : частка зразка 1, частка зразка 2
  • z: z-критичне значення на основі рівня довіри
  • n 1 , n 2 : розмір вибірки 1, розмір вибірки 2

Приклад. Припустімо, ми хочемо оцінити різницю між часткою жителів, які підтримують певний закон у графстві А, та часткою тих, хто підтримує закон у графстві Б. Ось підсумкові дані для кожної вибірки:

Зразок 1:

  • n 1 = 100
  • p 1 = 0,62 (тобто 62 мешканці зі 100 підтримують закон)

Зразок 2:

  • n2 = 100
  • p 2 = 0,46 (тобто 46 мешканців зі 100 підтримують закон)

У наведеному нижче коді показано, як обчислити 95% довірчий інтервал для справжньої різниці в частці жителів, які підтримують закон між округами:

 #input sample sizes and sample proportions
n1 <- 100
p1 <- .62

n2 <- 100
p2 <- .46

#calculate margin of error
margin <- qnorm(0.975)*sqrt(p1*(1-p1)/n1 + p2*(1-p2)/n2)

#calculate lower and upper bounds of confidence interval
low <- (p1-p2) - margin
low

[1] 0.02364509


high <- (p1-p2) + margin
high

[1] 0.2963549

95% довірчий інтервал для справжньої різниці у частці жителів, які підтримують закон між округами, становить [0,024, 0,296] .

Ви можете знайти більше підручників з R тут .

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *