평균 간의 차이에 대한 신뢰 구간
평균 간의 차이에 대한 신뢰구간(CI)은 일정 수준의 신뢰도를 가지고 두 모집단 평균 간의 실제 차이가 포함될 가능성이 높은 값의 범위입니다.
이 튜토리얼에서는 다음 내용을 설명합니다.
- 이 신뢰 구간을 만드는 동기입니다.
- 이 신뢰 구간을 생성하는 공식입니다.
- 이 신뢰 구간을 계산하는 방법의 예입니다.
- 이 신뢰 구간을 해석하는 방법.
평균의 차이에 대한 CI: 동기부여
연구자들은 종종 두 모집단의 평균 차이를 추정하려고 합니다. 이 차이를 추정하기 위해 각 모집단에서 무작위 표본을 수집하고 각 표본의 평균을 계산합니다. 그런 다음 두 평균 간의 차이를 비교할 수 있습니다.
그러나 표본 평균 간의 차이가 모집단 평균 간의 실제 차이와 일치하는지 여부는 확실히 알 수 없습니다. 이것이 두 평균 간의 차이에 대한 신뢰 구간을 만들 수 있는 이유입니다. 이는 모집단 평균 간의 실제 차이를 포함할 가능성이 있는 값의 범위를 제공합니다.
예를 들어, 서로 다른 두 종의 거북이 사이의 평균 체중 차이를 추정한다고 가정해 보겠습니다. 각 개체군에는 수천 마리의 거북이가 있기 때문에 각 거북이를 개별적으로 돌아다니며 무게를 측정하는 것은 너무 많은 시간과 비용이 소요됩니다.
대신, 각 개체군에서 15마리의 거북이를 단순 무작위 표본으로 추출하고 각 표본의 평균 체중을 사용하여 두 개체군 간의 평균 체중의 실제 차이를 추정할 수 있습니다.

문제는 표본이 무작위이기 때문에 두 표본 간의 평균 체중 차이가 두 모집단 간의 평균 체중 차이와 정확히 일치한다고 보장할 수 없다는 것입니다. 따라서 이러한 불확실성을 포착하기 위해 두 모집단 간의 실제 평균 체중 차이를 포함할 가능성이 있는 값 범위를 포함하는 신뢰 구간을 만들 수 있습니다.
평균 간의 차이에 대한 CI: 공식
다음 공식을 사용하여 두 평균 간의 차이에 대한 신뢰 구간을 계산합니다.
신뢰 구간 = ( x 1 – x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))
금:
- x 1 , x 2 : 표본 1의 평균, 표본 2의 평균
- t: 신뢰 수준 및 (n 1 + n 2 -2) 자유도를 기반으로 하는 t-임계 값
- s p 2 : 합동 분산
- n 1 , n 2 : 표본 크기 1, 표본 크기 2
금:
- 합동 분산은 다음과 같이 계산됩니다. s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
- t 임계값 t는 역 t 분포 계산기를 사용하여 찾을 수 있습니다.
평균 간의 차이에 대한 CI: 예
서로 다른 두 종의 거북이 사이의 평균 체중 차이를 추정한다고 가정해 보겠습니다. 따라서 우리는 각 개체군에서 15마리의 거북이를 무작위로 추출할 것입니다. 각 샘플의 요약 데이터는 다음과 같습니다.
샘플 1:
- x1 = 310
- 초 1 = 18.5
- n 1 = 15
샘플 2:
- x2 = 300
- s2 = 16.4
- n2 = 15
모집단 평균 체중의 실제 차이에 대한 다양한 신뢰 구간을 찾는 방법은 다음과 같습니다.
90% 신뢰 구간:
(310-300) +/- 1.70*√((305.61/15) + (305.61/15)) = [-0.8589, 20.8589]
95% 신뢰 구간:
(310-300) +/- 2.05*√((305.61/15) + (305.61/15)) = [-3.0757, 23.0757]
99% 신뢰 구간:
(310-300) +/- 2.76*√((305.61/15) + (305.61/15)) = [-7.6389, 27.6389]
참고: 평균 차이 계산기에 대한 통계적 신뢰 구간을 사용하여 이러한 신뢰 구간을 찾을 수도 있습니다.
신뢰 수준이 높을수록 신뢰 구간이 넓어지는 것을 알 수 있습니다. 간격이 넓을수록 실제 모집단 평균이 포함될 가능성이 높으므로 간격에 실제 모집단 평균이 포함되어 있다고 더 “신뢰”할 수 있으므로 이는 의미가 있습니다.
평균의 차이에 대한 CI : 해석
신뢰 구간을 해석하는 방법은 다음과 같습니다.
[-3.0757, 23.0757]의 신뢰 구간에 두 거북이 개체군 간의 실제 평균 체중 차이가 포함될 확률은 95%입니다.
이 간격에는 “0” 값이 포함되어 있으므로 이는 두 개체군 거북이의 평균 체중에 차이가 없을 가능성이 있음을 의미합니다. 즉, 우리는 이 두 개체군의 거북이 사이에 평균 체중에 차이가 있다고 95% 신뢰도로 말할 수 없습니다.