Як знайти довірчі інтервали в r (з прикладами)
Довірчий інтервал – це діапазон значень, який, ймовірно, містить параметр сукупності з певним рівнем довіри.
Розраховується за такою загальною формулою:
Довірчий інтервал = (точкова оцінка) +/- (критичне значення)* (стандартна помилка)
Ця формула створює інтервал із нижньою межею та верхньою межею, який, ймовірно, містить параметр сукупності з певним рівнем достовірності:
Довірчий інтервал = [нижня межа, верхня межа]
У цьому посібнику пояснюється, як обчислити такі довірчі інтервали в R:
1. Довірчий інтервал для середнього
2. Довірчий інтервал для різниці середніх
3. Довірчий інтервал для пропорції
4. Довірчий інтервал різниці пропорцій
Ходімо!
Приклад 1: Довірчий інтервал для середнього
Ми використовуємо таку формулу, щоб обчислити довірчий інтервал для середнього :
Довірчий інтервал = x +/- t n-1, 1-α/2 *(s/√n)
золото:
- x : вибірка середніх
- t: t-критичне значення
- s: вибіркове стандартне відхилення
- n: розмір вибірки
Приклад: припустимо, ми збираємо випадкову вибірку черепах із такою інформацією:
- Обсяг вибірки n = 25
- Середня маса зразка х = 300
- Стандартне відхилення вибірки s = 18,5
Наступний код показує, як обчислити 95% довірчий інтервал для справжньої середньої ваги популяції черепах:
#input sample size, sample mean, and sample standard deviation n <- 25 xbar <- 300 s <- 18.5 #calculate margin of error margin <- qt(0.975,df=n-1)*s/sqrt(n) #calculate lower and upper bounds of confidence interval low <- xbar - margin low [1] 292.3636 high <- xbar + margin high [1] 307.6364
95% довірчий інтервал для справжньої середньої ваги популяції черепах становить [292,36, 307,64] .
Приклад 2: Довірчий інтервал для різниці середніх
Ми використовуємо наступну формулу для розрахунку довірчого інтервалу для різниці в середніх сукупності :
Довірчий інтервал = ( x 1 – x 2 ) +/- t*√ ((s p 2 /n 1 ) + (s p 2 /n 2 ))
золото:
- x 1 , x 2 : середнє значення зразка 1, середнє значення зразка 2
- t: t-критичне значення на основі рівня довіри та (n 1 + n 2 -2) ступенів свободи
- s p 2 : сукупна дисперсія, обчислена як ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
- t: t-критичне значення
- n 1 , n 2 : розмір вибірки 1, розмір вибірки 2
Приклад: припустимо, ми хочемо оцінити різницю в середній вазі між двома різними видами черепах. Тому ми збираємо випадкову вибірку з 15 черепах з кожної популяції. Ось підсумкові дані для кожного зразка:
Зразок 1:
- х1 = 310
- s 1 = 18,5
- n 1 = 15
Зразок 2:
- х2 = 300
- s2 = 16,4
- n2 = 15
У наведеному нижче коді показано, як обчислити 95% довірчий інтервал для справжньої різниці в середніх значеннях сукупності:
#input sample size, sample mean, and sample standard deviation n1 <- 15 xbar1 <- 310 s1 <- 18.5 n2 <- 15 xbar2 <- 300 s2 <- 16.4 #calculate pooled variance sp = ((n1-1)*s1^2 + (n2-1)*s2^2) / (n1+n2-2) #calculate margin of error margin <- qt(0.975,df=n1+n2-1)*sqrt(sp/n1 + sp/n2) #calculate lower and upper bounds of confidence interval low <- (xbar1-xbar2) - margin low [1] -3.055445 high <- (xbar1-xbar2) + margin high [1] 23.05544
95% довірчий інтервал для справжньої різниці між середніми сукупностями становить [-3,06, 23,06] .
Приклад 3: Довірчий інтервал для пропорції
Ми використовуємо таку формулу, щоб обчислити довірчий інтервал для пропорції :
Довірчий інтервал = p +/- z*(√ p(1-p) / n )
золото:
- p: частка зразка
- z: вибране значення z
- n: розмір вибірки
Приклад: припустимо, ми хочемо оцінити частку жителів округу, які підтримують певний закон. Ми відбираємо випадкову вибірку зі 100 мешканців і запитуємо їхню позицію щодо закону. Ось результати:
- Обсяг вибірки n = 100
- Частка на користь закону р = 0,56
Наступний код показує, як обчислити 95% довірчий інтервал для справжньої частки жителів округу, які підтримують закон:
#input sample size and sample proportion n <- 100 p <- .56 #calculate margin of error margin <- qnorm(0.975)*sqrt(p*(1-p)/n) #calculate lower and upper bounds of confidence interval low <- p - margin low [1] 0.4627099 high <- p + margin high [1] 0.6572901
95% довірчий інтервал для справжньої частки жителів округу, які підтримують закон, становить [0,463, 0,657] .
Приклад 4: Довірчий інтервал для різниці в пропорціях
Ми використовуємо наступну формулу для розрахунку довірчого інтервалу для різниці в пропорціях :
Довірчий інтервал = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )
золото:
- p 1 , p 2 : частка зразка 1, частка зразка 2
- z: z-критичне значення на основі рівня довіри
- n 1 , n 2 : розмір вибірки 1, розмір вибірки 2
Приклад. Припустімо, ми хочемо оцінити різницю між часткою жителів, які підтримують певний закон у графстві А, та часткою тих, хто підтримує закон у графстві Б. Ось підсумкові дані для кожної вибірки:
Зразок 1:
- n 1 = 100
- p 1 = 0,62 (тобто 62 мешканці зі 100 підтримують закон)
Зразок 2:
- n2 = 100
- p 2 = 0,46 (тобто 46 мешканців зі 100 підтримують закон)
У наведеному нижче коді показано, як обчислити 95% довірчий інтервал для справжньої різниці в частці жителів, які підтримують закон між округами:
#input sample sizes and sample proportions n1 <- 100 p1 <- .62 n2 <- 100 p2 <- .46 #calculate margin of error margin <- qnorm(0.975)*sqrt(p1*(1-p1)/n1 + p2*(1-p2)/n2) #calculate lower and upper bounds of confidence interval low <- (p1-p2) - margin low [1] 0.02364509 high <- (p1-p2) + margin high [1] 0.2963549
95% довірчий інтервал для справжньої різниці у частці жителів, які підтримують закон між округами, становить [0,024, 0,296] .
Ви можете знайти більше підручників з R тут .