상관계수에 대한 신뢰구간
상관계수에 대한 신뢰구간은 일정 수준의 신뢰도를 갖는 모집단 상관계수를 포함할 가능성이 있는 값의 범위입니다.
이 튜토리얼에서는 다음 내용을 설명합니다.
- 이러한 유형의 신뢰 구간을 만드는 동기입니다.
- 이러한 유형의 신뢰 구간을 생성하는 공식입니다.
- 이러한 유형의 신뢰 구간을 만드는 방법에 대한 예입니다.
- 이러한 유형의 신뢰 구간을 해석하는 방법.
상관계수에 대한 신뢰구간: 동기
상관계수에 대한 신뢰구간을 만드는 이유는 모집단 상관계수를 추정할 때 불확실성을 포착하기 위해서입니다.
예를 들어, 특정 카운티 주민의 키와 몸무게 사이의 상관 계수를 추정한다고 가정해 보겠습니다. 해당 군에는 수천 명의 주민이 살고 있기 때문에 각 주민의 키와 몸무게에 대한 정보를 여기저기 돌아다니며 수집하는 것은 너무 많은 비용과 시간이 소요될 것입니다.
대신, 우리는 주민의 간단한 무작위 표본을 선택하고 그들에 대한 정보를 간단히 수집할 수 있습니다.
주민의 무작위 표본을 선택하기 때문에 표본 주민의 키와 체중 사이의 상관 계수가 더 큰 인구의 상관 계수와 정확히 일치한다는 보장은 없습니다.
따라서 이러한 불확실성을 포착하기 위해 해당 카운티 주민의 키와 몸무게 사이의 실제 상관 계수가 포함될 가능성이 있는 다양한 값을 포함하는 신뢰 구간을 만들 수 있습니다.
상관계수에 대한 신뢰구간: 공식
우리는 표본 크기 n 과 표본 상관 계수 r 을 기반으로 모집단 상관 계수에 대한 신뢰 구간을 계산하기 위해 다음 단계를 사용합니다.
1단계: Fisher 변환을 수행합니다.
z r = ln((1+r) / (1-r)) / 2라고 하자.
2단계: 로그의 상한과 하한을 찾습니다.
L = z r – (z 1-α/2 /√ n-3 )이라고 하자
U = z r + (z 1-α/2 /√ n-3 )라고 하자.
3단계: 신뢰 구간을 찾습니다.
최종 신뢰 구간은 다음 공식을 사용하여 찾을 수 있습니다.
신뢰 구간 = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
상관 계수에 대한 신뢰 구간: 예
특정 카운티 주민의 키와 몸무게 사이의 상관 계수를 추정한다고 가정해 보겠습니다. 우리는 주민 30명의 무작위 표본을 선택하고 다음 정보를 찾습니다.
- 표본 크기 n = 30
- 키와 몸무게의 상관계수 r = 0.56
모집단 상관 계수에 대한 95% 신뢰 구간을 찾는 방법은 다음과 같습니다.
1단계: Fisher 변환을 수행합니다.
z r = ln((1+r) / (1-r)) / 2 = ln((1+.56) / (1-.56)) / 2 = 0.6328
2단계: 로그의 상한과 하한을 찾습니다.
L = z r – (z 1-α/2 /√ n-3 ) = 0.6328 – (1.96 /√ 30-3 ) = 0.2556
U = z r + (z 1-α/2 /√ n-3 ) = 0.6328 + (1.96 /√ 30-3 ) = 1.01
3단계: 신뢰 구간을 찾습니다.
신뢰 구간 = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
신뢰 구간 = [(e 2(.2556) -1)/(e 2(.2556) +1), (e 2(1.01) -1)/(e 2(1.01) +1)] = [. 2502, .7658]
참고: 상관 계수 계산기에 대한 신뢰 구간을 사용하여 이 신뢰 구간을 찾을 수도 있습니다.
상관 계수에 대한 신뢰 구간: 해석
신뢰 구간을 해석하는 방법은 다음과 같습니다.
[.2502, .7658]의 신뢰 구간에 해당 카운티 주민의 키와 몸무게 사이의 실제 인구 상관 계수가 포함될 확률은 95%입니다.
같은 말을 다른 방식으로 말하면, 실제 모집단 상관 계수가 95% 신뢰 구간을 벗어날 확률은 5%에 불과합니다.
즉, 이 카운티 주민의 키와 몸무게 사이의 실제 인구 상관 계수가 0.2502보다 작거나 0.7658보다 클 확률은 5%에 불과합니다.