비율 차이에 대한 신뢰 구간


비율 차이에 대한 신뢰구간(CI)은 일정 수준의 신뢰도에서 두 모집단 비율의 실제 차이가 포함될 가능성이 높은 값의 범위입니다.

이 튜토리얼에서는 다음 내용을 설명합니다.

  • 이 신뢰 구간을 만드는 동기입니다.
  • 이 신뢰 구간을 생성하는 공식입니다.
  • 이 신뢰 구간을 계산하는 방법의 예입니다.
  • 이 신뢰 구간을 해석하는 방법.

비율의 차이에 대한 CI: 동기부여

연구자들은 종종 두 모집단 비율 간의 차이를 추정하려고 합니다. 이 차이를 추정하기 위해 각 모집단에서 무작위 표본을 수집하고 각 표본의 비율을 계산합니다. 그런 다음 두 비율의 차이를 비교할 수 있습니다.

그러나 표본 비율 간의 차이가 모집단 비율 간의 실제 차이와 일치하는지 여부는 확실히 알 수 없습니다. 이것이 두 비율 간의 차이에 대한 신뢰 구간을 만들 수 있는 이유입니다. 이는 인구 비율 간의 실제 차이를 포함할 수 있는 다양한 값을 제공합니다.

예를 들어, A 카운티의 특정 법률을 지지하는 주민 비율과 B 카운티의 법률을 지지하는 주민 비율 간의 차이를 추정한다고 가정합니다.

각 군마다 수천 명의 주민이 있기 때문에 각 군의 모든 주민을 일일이 돌아다니며 조사하는 것은 시간과 비용이 너무 많이 듭니다.

대신, 우리는 각 카운티에서 주민의 간단한 무작위 표본을 추출하고 각 표본의 법에 유리한 비율을 사용하여 두 카운티 간의 비율의 실제 차이를 추정할 수 있습니다.

표본이 무작위이기 때문에 두 표본 간의 비율 차이가 두 모집단 간의 비율 차이와 정확히 일치한다고 보장할 수 없습니다. 따라서 이러한 불확실성을 포착하기 위해 두 모집단 간의 실제 비율 차이를 포함할 가능성이 있는 값 범위를 포함하는 신뢰 구간을 만들 수 있습니다.

비율 차이에 대한 CI: 공식

다음 공식을 사용하여 두 모집단 비율 간의 차이에 대한 신뢰 구간을 계산합니다.

신뢰 구간 = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )

금:

  • p 1 , p 2 : 표본 1의 비율, 표본 2의 비율
  • z: 신뢰 수준에 따른 z 임계값
  • n 1 , n 2 : 표본 크기 1, 표본 크기 2

사용하는 z 값은 선택한 신뢰 수준에 따라 달라집니다. 다음 표에는 가장 일반적인 신뢰 수준 선택에 해당하는 z 값이 나와 있습니다.

어느 정도의 자신감 z 값
0.90 1,645
0.95 1.96
0.99 2.58

신뢰 수준이 높을수록 z 값이 커지고 신뢰 구간이 넓어집니다. 이는 예를 들어 동일한 데이터 세트에 대해 95% 신뢰 구간이 90% 신뢰 구간보다 넓다는 것을 의미합니다.

비율 차이에 대한 CI:

A 카운티의 특정 법률을 지지하는 주민 비율과 B 카운티의 법률을 지지하는 주민 비율 간의 차이를 추정한다고 가정합니다. 다음은 각 표본에 대한 요약 데이터입니다.

샘플 1:

  • n 1 = 100
  • p 1 = 0.62(즉, 주민 100명 중 62명이 법을 지지함)

샘플 2:

  • n2 = 100
  • p 2 = 0.46(즉, 주민 100명 중 46명이 법을 지지함)

모집단 비율의 차이에 대한 다양한 신뢰 구간을 찾는 방법은 다음과 같습니다.

90% 신뢰 구간:

(.62-.46) +/- 1.645*√(.62(1-.62)/100 + .46(1-.46)/100) = [.0456, .2744]

95% 신뢰 구간:

(.62-.46) +/- 1.96*√(.62(1-.62)/100 + .46(1-.46)/100) = [.0236, .2964]

99% 신뢰 구간:

(0.62-0.46) +/- 2.58*√(0.62(1-0.62)/100 + 0.46(1-0.46)/100) = [-0.0192, 0.3392]

참고: 비율 차이에 대한 신뢰 구간 계산기를 사용하여 이러한 신뢰 구간을 찾을 수도 있습니다.

비율의 차이에 대한 CI : 해석

신뢰 구간을 해석하는 방법은 다음과 같습니다.

[.0236, .2964]의 신뢰 구간에 두 카운티 간 법을 지지하는 주민 비율의 실제 차이가 포함될 확률은 95%입니다.

이 간격에는 “0” 값이 포함되어 있지 않으므로 이는 B 카운티와 A 카운티에서 이 법을 지지하는 주민의 비율에 실제 차이가 있을 가능성이 매우 높다는 것을 의미합니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다