비율 차이에 대한 신뢰 구간
비율 차이에 대한 신뢰구간(CI)은 일정 수준의 신뢰도에서 두 모집단 비율의 실제 차이가 포함될 가능성이 높은 값의 범위입니다.
이 튜토리얼에서는 다음 내용을 설명합니다.
- 이 신뢰 구간을 만드는 동기입니다.
- 이 신뢰 구간을 생성하는 공식입니다.
- 이 신뢰 구간을 계산하는 방법의 예입니다.
- 이 신뢰 구간을 해석하는 방법.
비율의 차이에 대한 CI: 동기부여
연구자들은 종종 두 모집단 비율 간의 차이를 추정하려고 합니다. 이 차이를 추정하기 위해 각 모집단에서 무작위 표본을 수집하고 각 표본의 비율을 계산합니다. 그런 다음 두 비율의 차이를 비교할 수 있습니다.
그러나 표본 비율 간의 차이가 모집단 비율 간의 실제 차이와 일치하는지 여부는 확실히 알 수 없습니다. 이것이 두 비율 간의 차이에 대한 신뢰 구간을 만들 수 있는 이유입니다. 이는 인구 비율 간의 실제 차이를 포함할 수 있는 다양한 값을 제공합니다.
예를 들어, A 카운티의 특정 법률을 지지하는 주민 비율과 B 카운티의 법률을 지지하는 주민 비율 간의 차이를 추정한다고 가정합니다.
각 군마다 수천 명의 주민이 있기 때문에 각 군의 모든 주민을 일일이 돌아다니며 조사하는 것은 시간과 비용이 너무 많이 듭니다.
대신, 우리는 각 카운티에서 주민의 간단한 무작위 표본을 추출하고 각 표본의 법에 유리한 비율을 사용하여 두 카운티 간의 비율의 실제 차이를 추정할 수 있습니다.
표본이 무작위이기 때문에 두 표본 간의 비율 차이가 두 모집단 간의 비율 차이와 정확히 일치한다고 보장할 수 없습니다. 따라서 이러한 불확실성을 포착하기 위해 두 모집단 간의 실제 비율 차이를 포함할 가능성이 있는 값 범위를 포함하는 신뢰 구간을 만들 수 있습니다.
비율 차이에 대한 CI: 공식
다음 공식을 사용하여 두 모집단 비율 간의 차이에 대한 신뢰 구간을 계산합니다.
신뢰 구간 = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )
금:
- p 1 , p 2 : 표본 1의 비율, 표본 2의 비율
- z: 신뢰 수준에 따른 z 임계값
- n 1 , n 2 : 표본 크기 1, 표본 크기 2
사용하는 z 값은 선택한 신뢰 수준에 따라 달라집니다. 다음 표에는 가장 일반적인 신뢰 수준 선택에 해당하는 z 값이 나와 있습니다.
어느 정도의 자신감 | z 값 |
---|---|
0.90 | 1,645 |
0.95 | 1.96 |
0.99 | 2.58 |
신뢰 수준이 높을수록 z 값이 커지고 신뢰 구간이 넓어집니다. 이는 예를 들어 동일한 데이터 세트에 대해 95% 신뢰 구간이 90% 신뢰 구간보다 넓다는 것을 의미합니다.
비율 차이에 대한 CI: 예
A 카운티의 특정 법률을 지지하는 주민 비율과 B 카운티의 법률을 지지하는 주민 비율 간의 차이를 추정한다고 가정합니다. 다음은 각 표본에 대한 요약 데이터입니다.
샘플 1:
- n 1 = 100
- p 1 = 0.62(즉, 주민 100명 중 62명이 법을 지지함)
샘플 2:
- n2 = 100
- p 2 = 0.46(즉, 주민 100명 중 46명이 법을 지지함)
모집단 비율의 차이에 대한 다양한 신뢰 구간을 찾는 방법은 다음과 같습니다.
90% 신뢰 구간:
(.62-.46) +/- 1.645*√(.62(1-.62)/100 + .46(1-.46)/100) = [.0456, .2744]
95% 신뢰 구간:
(.62-.46) +/- 1.96*√(.62(1-.62)/100 + .46(1-.46)/100) = [.0236, .2964]
99% 신뢰 구간:
(0.62-0.46) +/- 2.58*√(0.62(1-0.62)/100 + 0.46(1-0.46)/100) = [-0.0192, 0.3392]
참고: 비율 차이에 대한 신뢰 구간 계산기를 사용하여 이러한 신뢰 구간을 찾을 수도 있습니다.
비율의 차이에 대한 CI : 해석
신뢰 구간을 해석하는 방법은 다음과 같습니다.
[.0236, .2964]의 신뢰 구간에 두 카운티 간 법을 지지하는 주민 비율의 실제 차이가 포함될 확률은 95%입니다.
이 간격에는 “0” 값이 포함되어 있지 않으므로 이는 B 카운티와 A 카운티에서 이 법을 지지하는 주민의 비율에 실제 차이가 있을 가능성이 매우 높다는 것을 의미합니다.