Довірчий інтервал для коефіцієнта кореляції
Інтервал довіри для коефіцієнта кореляції – це діапазон значень, який, імовірно, міститиме коефіцієнт кореляції сукупності з певним рівнем достовірності.
Цей посібник пояснює наступне:
- Мотивація створення такого типу довірчого інтервалу.
- Формула створення даного типу довірчого інтервалу.
- Приклад того, як створити цей тип довірчого інтервалу.
- Як інтерпретувати цей тип довірчого інтервалу.
Довірчий інтервал для коефіцієнта кореляції: мотивація
Причиною створення довірчого інтервалу для коефіцієнта кореляції є врахування нашої невизначеності під час оцінки коефіцієнта кореляції сукупності.
Наприклад, припустимо, що ми хочемо оцінити коефіцієнт кореляції між зростом і вагою жителів певного округу. Оскільки в окрузі проживають тисячі жителів, було б занадто дорого та довго обходити та збирати інформацію про зріст і вагу кожного жителя.
Замість цього ми могли б вибрати просту випадкову вибірку жителів і просто зібрати інформацію про них.
Оскільки ми відбираємо випадкову вибірку мешканців, немає гарантії, що коефіцієнт кореляції між зростом і вагою цих мешканців вибірки точно відповідатиме коефіцієнту кореляції більшої популяції.
Отже, щоб зафіксувати цю невизначеність, ми можемо створити довірчий інтервал, що містить діапазон значень, які, ймовірно, містять справжній коефіцієнт кореляції між зростом і вагою жителів цього округу.
Довірчий інтервал для коефіцієнта кореляції: формула
Ми використовуємо наступні кроки, щоб обчислити довірчий інтервал для коефіцієнта кореляції сукупності на основі розміру вибірки n і коефіцієнта кореляції вибірки r .
Крок 1: Виконайте перетворення Фішера.
Нехай z r = ln((1+r) / (1-r)) / 2
Крок 2: Знайдіть верхню та нижню межі журналу.
Нехай L = z r – (z 1-α/2 /√ n-3 )
Нехай U = z r + (z 1-α/2 /√ n-3 )
Крок 3: Знайдіть довірчий інтервал.
Кінцевий довірчий інтервал можна знайти за такою формулою:
Довірчий інтервал = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
Довірчий інтервал для коефіцієнта кореляції: приклад
Припустимо, ми хочемо оцінити коефіцієнт кореляції між зростом і вагою жителів певного округу. Ми вибираємо випадкову вибірку з 30 жителів і знаходимо таку інформацію:
- Обсяг вибірки n = 30
- Коефіцієнт кореляції між зростом і вагою r = 0,56
Ось як знайти 95% довірчий інтервал для коефіцієнта кореляції сукупності:
Крок 1: Виконайте перетворення Фішера.
Нехай z r = ln((1+r) / (1-r)) / 2 = ln((1+.56) / (1-.56)) / 2 = 0,6328
Крок 2: Знайдіть верхню та нижню межі журналу.
Нехай L = z r – (z 1-α/2 /√ n-3 ) = 0,6328 – (1,96 /√ 30-3 ) = 0,2556
Нехай U = z r + (z 1-α/2 /√ n-3 ) = 0,6328 + (1,96 /√ 30-3 ) = 1,01
Крок 3: Знайдіть довірчий інтервал.
Довірчий інтервал = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
Довірчий інтервал = [(e 2(.2556) -1)/(e 2(.2556) +1), (e 2(1.01) -1)/(e 2(1.01) +1)] = [. 2502, 0,7658]
Примітка. Ви також можете знайти цей довірчий інтервал за допомогою довірчого інтервалу для калькулятора коефіцієнта кореляції .
Довірчий інтервал для коефіцієнта кореляції: інтерпретація
Спосіб інтерпретації довірчого інтервалу такий:
Існує 95% ймовірність того, що довірчий інтервал [0,2502, 0,7658] містить справжній коефіцієнт кореляції населення між зростом і вагою жителів цього округу.
Іншим способом сказати те ж саме є те, що існує лише 5% ймовірність того, що справжній коефіцієнт кореляції популяції лежить за межами 95% довірчого інтервалу.
Тобто існує лише 5% ймовірність того, що справжній популяційний коефіцієнт кореляції між зростом і вагою жителів цього округу буде меншим за 0,2502 або більшим за 0,7658.