Доверительный интервал для коэффициента корреляции
Доверительный интервал для коэффициента корреляции — это диапазон значений, который может содержать коэффициент корреляции населения с определенным уровнем достоверности.
В этом руководстве объясняется следующее:
- Мотивация создания такого типа доверительного интервала.
- Формула для создания доверительного интервала этого типа.
- Пример того, как создать доверительный интервал такого типа.
- Как интерпретировать этот тип доверительного интервала.
Доверительный интервал для коэффициента корреляции: мотивация
Причина создания доверительного интервала для коэффициента корреляции состоит в том, чтобы уловить нашу неопределенность при оценке коэффициента корреляции населения.
Например, предположим, что мы хотим оценить коэффициент корреляции между ростом и весом жителей определенного округа. Поскольку в округе проживают тысячи жителей, обходить и собирать информацию о росте и весе каждого жителя было бы слишком дорого и отнимало много времени.
Вместо этого мы могли бы выбрать простую случайную выборку жителей и просто собрать о них информацию.
Поскольку мы выбираем случайную выборку жителей, нет никакой гарантии, что коэффициент корреляции между ростом и весом этих выбранных жителей будет точно соответствовать коэффициенту корреляции более крупной популяции.
Итак, чтобы уловить эту неопределенность, мы можем создать доверительный интервал, содержащий диапазон значений, которые, вероятно, будут содержать истинный коэффициент корреляции между ростом и весом жителей этого округа.
Доверительный интервал для коэффициента корреляции: формула
Мы используем следующие шаги для расчета доверительного интервала для коэффициента корреляции совокупности на основе размера выборки n и коэффициента корреляции выборки r .
Шаг 1: Выполните преобразование Фишера.
Пусть z r = ln((1+r)/(1-r))/2
Шаг 2: Найдите верхний и нижний пределы журнала.
Пусть L = z r – (z 1-α/2 /√ n-3 )
Пусть U = z r + (z 1-α/2 /√ n-3 )
Шаг 3: Найдите доверительный интервал.
Окончательный доверительный интервал можно найти по следующей формуле:
Доверительный интервал = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
Доверительный интервал для коэффициента корреляции: пример
Предположим, мы хотим оценить коэффициент корреляции между ростом и весом жителей определенного округа. Мы выбираем случайную выборку из 30 жителей и находим следующую информацию:
- Размер выборки n = 30
- Коэффициент корреляции между ростом и весом r = 0,56
Вот как найти 95% доверительный интервал для коэффициента корреляции населения:
Шаг 1: Выполните преобразование Фишера.
Пусть z r = ln((1+r)/(1-r))/2 = ln((1+.56)/(1-.56))/2 = 0,6328
Шаг 2: Найдите верхний и нижний пределы журнала.
Пусть L = z r – (z 1-α/2 /√ n-3 ) = 0,6328 – (1,96 /√ 30-3 ) = 0,2556.
Пусть U = z r + (z 1-α/2 /√ n-3 ) = 0,6328 + (1,96 /√ 30-3 ) = 1,01.
Шаг 3: Найдите доверительный интервал.
Доверительный интервал = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
Доверительный интервал = [(e 2(0,2556) -1)/(e 2(0,2556) +1), (e 2(1,01) -1)/(e 2(1,01) +1)] = [. 2502, .7658]
Примечание. Этот доверительный интервал также можно найти с помощью доверительного интервала для калькулятора коэффициента корреляции .
Доверительный интервал для коэффициента корреляции: интерпретация
Мы интерпретируем доверительный интервал следующим образом:
Существует 95% вероятность того, что доверительный интервал [0,2502, 0,7658] содержит истинный коэффициент корреляции населения между ростом и весом жителей этого округа.
То же самое можно сказать и по-другому: вероятность того, что истинный коэффициент популяционной корреляции лежит за пределами 95% доверительного интервала, составляет всего 5%.
То есть существует лишь 5% вероятность того, что истинный коэффициент популяционной корреляции между ростом и весом жителей этого округа будет меньше 0,2502 или больше 0,7658.