평균 간의 차이에 대한 신뢰 구간

에 의해 벤자민 앤더슨 7월 28, 2023 가이드 댓글 0개

평균 간의 차이에 대한 신뢰구간(CI)은 일정 수준의 신뢰도를 가지고 두 모집단 평균 간의 실제 차이가 포함될 가능성이 높은 값의 범위입니다.

이 튜토리얼에서는 다음 내용을 설명합니다.

이 신뢰 구간을 만드는 동기입니다.
이 신뢰 구간을 생성하는 공식입니다.
이 신뢰 구간을 계산하는 방법의 예입니다.
이 신뢰 구간을 해석하는 방법.

평균의 차이에 대한 CI: 동기부여

연구자들은 종종 두 모집단의 평균 차이를 추정하려고 합니다. 이 차이를 추정하기 위해 각 모집단에서 무작위 표본을 수집하고 각 표본의 평균을 계산합니다. 그런 다음 두 평균 간의 차이를 비교할 수 있습니다.

그러나 표본 평균 간의 차이가 모집단 평균 간의 실제 차이와 일치하는지 여부는 확실히 알 수 없습니다. 이것이 두 평균 간의 차이에 대한 신뢰 구간을 만들 수 있는 이유입니다. 이는 모집단 평균 간의 실제 차이를 포함할 가능성이 있는 값의 범위를 제공합니다.

예를 들어, 서로 다른 두 종의 거북이 사이의 평균 체중 차이를 추정한다고 가정해 보겠습니다. 각 개체군에는 수천 마리의 거북이가 있기 때문에 각 거북이를 개별적으로 돌아다니며 무게를 측정하는 것은 너무 많은 시간과 비용이 소요됩니다.

대신, 각 개체군에서 15마리의 거북이를 단순 무작위 표본으로 추출하고 각 표본의 평균 체중을 사용하여 두 개체군 간의 평균 체중의 실제 차이를 추정할 수 있습니다.

두 모집단 평균 간의 차이에 대한 신뢰 구간

문제는 표본이 무작위이기 때문에 두 표본 간의 평균 체중 차이가 두 모집단 간의 평균 체중 차이와 정확히 일치한다고 보장할 수 없다는 것입니다. 따라서 이러한 불확실성을 포착하기 위해 두 모집단 간의 실제 평균 체중 차이를 포함할 가능성이 있는 값 범위를 포함하는 신뢰 구간을 만들 수 있습니다.

평균 간의 차이에 대한 CI: 공식

다음 공식을 사용하여 두 평균 간의 차이에 대한 신뢰 구간을 계산합니다.

신뢰 구간 = ( x ₁ – x ₂ ) +/- t*√((s _p ² /n ₁ ) + (s _p ² /n ₂ ))

금:

x ₁ , x ₂ : 표본 1의 평균, 표본 2의 평균
t: 신뢰 수준 및 (n ₁ + n ₂ -2) 자유도를 기반으로 하는 t-임계 값
s _p ² : 합동 분산
n ₁ , n ₂ : 표본 크기 1, 표본 크기 2

금:

합동 분산은 다음과 같이 계산됩니다. s _p ² = ((n ₁ -1)s ₁ ² + (n ₂ -1)s ₂ ² ) / (n ₁ +n ₂ -2)
t 임계값 t는 역 t 분포 계산기를 사용하여 찾을 수 있습니다.

평균 간의 차이에 대한 CI: 예

서로 다른 두 종의 거북이 사이의 평균 체중 차이를 추정한다고 가정해 보겠습니다. 따라서 우리는 각 개체군에서 15마리의 거북이를 무작위로 추출할 것입니다. 각 샘플의 요약 데이터는 다음과 같습니다.

샘플 1:

x1 = ₃₁₀
초 ₁ = 18.5
n ₁ = 15

샘플 2:

x2 ₌ 300
_s2 = 16.4
_n2 = 15

모집단 평균 체중의 실제 차이에 대한 다양한 신뢰 구간을 찾는 방법은 다음과 같습니다.

90% 신뢰 구간:

(310-300) +/- 1.70*√((305.61/15) + (305.61/15)) = [-0.8589, 20.8589]

95% 신뢰 구간:

(310-300) +/- 2.05*√((305.61/15) + (305.61/15)) = [-3.0757, 23.0757]

99% 신뢰 구간:

(310-300) +/- 2.76*√((305.61/15) + (305.61/15)) = [-7.6389, 27.6389]

참고: 평균 차이 계산기에 대한 통계적 신뢰 구간을 사용하여 이러한 신뢰 구간을 찾을 수도 있습니다.

신뢰 수준이 높을수록 신뢰 구간이 넓어지는 것을 알 수 있습니다. 간격이 넓을수록 실제 모집단 평균이 포함될 가능성이 높으므로 간격에 실제 모집단 평균이 포함되어 있다고 더 “신뢰”할 수 있으므로 이는 의미가 있습니다.

평균의 차이에 대한 CI : 해석

신뢰 구간을 해석하는 방법은 다음과 같습니다.

[-3.0757, 23.0757]의 신뢰 구간에 두 거북이 개체군 간의 실제 평균 체중 차이가 포함될 확률은 95%입니다.

이 간격에는 “0” 값이 포함되어 있으므로 이는 두 개체군 거북이의 평균 체중에 차이가 없을 가능성이 있음을 의미합니다. 즉, 우리는 이 두 개체군의 거북이 사이에 평균 체중에 차이가 있다고 95% 신뢰도로 말할 수 없습니다.

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기