상관계수에 대한 신뢰구간


상관계수에 대한 신뢰구간은 일정 수준의 신뢰도를 갖는 모집단 상관계수를 포함할 가능성이 있는 값의 범위입니다.

이 튜토리얼에서는 다음 내용을 설명합니다.

  • 이러한 유형의 신뢰 구간을 만드는 동기입니다.
  • 이러한 유형의 신뢰 구간을 생성하는 공식입니다.
  • 이러한 유형의 신뢰 구간을 만드는 방법에 대한 예입니다.
  • 이러한 유형의 신뢰 구간을 해석하는 방법.

상관계수에 대한 신뢰구간: 동기

상관계수에 대한 신뢰구간을 만드는 이유는 모집단 상관계수를 추정할 때 불확실성을 포착하기 위해서입니다.

예를 들어, 특정 카운티 주민의 키와 몸무게 사이의 상관 계수를 추정한다고 가정해 보겠습니다. 해당 군에는 수천 명의 주민이 살고 있기 때문에 각 주민의 키와 몸무게에 대한 정보를 여기저기 돌아다니며 수집하는 것은 너무 많은 비용과 시간이 소요될 것입니다.

대신, 우리는 주민의 간단한 무작위 표본을 선택하고 그들에 대한 정보를 간단히 수집할 수 있습니다.

인구 비율 추정의 예

주민의 무작위 표본을 선택하기 때문에 표본 주민의 키와 체중 사이의 상관 계수가 더 큰 인구의 상관 계수와 정확히 일치한다는 보장은 없습니다.

따라서 이러한 불확실성을 포착하기 위해 해당 카운티 주민의 키와 몸무게 사이의 실제 상관 계수가 포함될 가능성이 있는 다양한 값을 포함하는 신뢰 구간을 만들 수 있습니다.

상관계수에 대한 신뢰구간: 공식

우리는 표본 크기 n 과 표본 상관 계수 r 을 기반으로 모집단 상관 계수에 대한 신뢰 구간을 계산하기 위해 다음 단계를 사용합니다.

1단계: Fisher 변환을 수행합니다.

z r = ln((1+r) / (1-r)) / 2라고 하자.

2단계: 로그의 상한과 하한을 찾습니다.

L = z r – (z 1-α/2 /√ n-3 )이라고 하자

U = z r + (z 1-α/2 /√ n-3 )라고 하자.

3단계: 신뢰 구간을 찾습니다.

최종 신뢰 구간은 다음 공식을 사용하여 찾을 수 있습니다.

신뢰 구간 = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]

상관 계수에 대한 신뢰 구간: 예

특정 카운티 주민의 키와 몸무게 사이의 상관 계수를 추정한다고 가정해 보겠습니다. 우리는 주민 30명의 무작위 표본을 선택하고 다음 정보를 찾습니다.

  • 표본 크기 n = 30
  • 키와 몸무게의 상관계수 r = 0.56

모집단 상관 계수에 대한 95% 신뢰 구간을 찾는 방법은 다음과 같습니다.

1단계: Fisher 변환을 수행합니다.

z r = ln((1+r) / (1-r)) / 2 = ln((1+.56) / (1-.56)) / 2 = 0.6328

2단계: 로그의 상한과 하한을 찾습니다.

L = z r – (z 1-α/2 /√ n-3 ) = 0.6328 – (1.96 /√ 30-3 ) = 0.2556

U = z r + (z 1-α/2 /√ n-3 ) = 0.6328 + (1.96 /√ 30-3 ) = 1.01

3단계: 신뢰 구간을 찾습니다.

신뢰 구간 = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]

신뢰 구간 = [(e 2(.2556) -1)/(e 2(.2556) +1), (e 2(1.01) -1)/(e 2(1.01) +1)] = [. 2502, .7658]

참고: 상관 계수 계산기에 대한 신뢰 구간을 사용하여 이 신뢰 구간을 찾을 수도 있습니다.

상관 계수에 대한 신뢰 구간: 해석

신뢰 구간을 해석하는 방법은 다음과 같습니다.

[.2502, .7658]의 신뢰 구간에 해당 카운티 주민의 키와 몸무게 사이의 실제 인구 상관 계수가 포함될 확률은 95%입니다.

같은 말을 다른 방식으로 말하면, 실제 모집단 상관 계수가 95% 신뢰 구간을 벗어날 확률은 5%에 불과합니다.

즉, 이 카운티 주민의 키와 몸무게 사이의 실제 인구 상관 계수가 0.2502보다 작거나 0.7658보다 클 확률은 5%에 불과합니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다